期刊文献+
共找到65篇文章
< 1 2 4 >
每页显示 20 50 100
基于混合兴趣主题模型的推荐方法
1
作者 邱云飞 田丰维 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2024年第2期241-247,共7页
针对跨领域项目推荐过程中用户兴趣稀疏造成的推荐冷启动问题,提出一种基于混合兴趣主题模型兴趣领域潜在狄利克雷分布(PA-LDA)的推荐方法。PA-LDA使用兴趣潜在狄利克雷分布(P-LDA)模块挖掘用户历史行为数据,生成关于目标项目中兴趣主... 针对跨领域项目推荐过程中用户兴趣稀疏造成的推荐冷启动问题,提出一种基于混合兴趣主题模型兴趣领域潜在狄利克雷分布(PA-LDA)的推荐方法。PA-LDA使用兴趣潜在狄利克雷分布(P-LDA)模块挖掘用户历史行为数据,生成关于目标项目中兴趣主题的概率分布,综合考虑主题和项目内容词对兴趣的影响进行参数估计建模,得到用户对目标项目的兴趣评价。PA-LDA使用领域潜在狄利克雷分布(A-LDA)得到领域对项目目标的兴趣评价,混合两类兴趣评价,使用top-k方法推荐目标项目。在EdX和GCSE两组真实数据集上进行实验,验证方法的有效性和准确性。研究结果表明:PA-LDA可以有效解释用户兴趣和领域兴趣对项目推荐的作用原理,实现多维领域推荐的兴趣特征捕捉,提升推荐的适应性与准确性。 展开更多
关键词 主题模型 用户兴趣 领域兴趣 兴趣混合 top-k推荐
原文传递
基于SWPF2vec和DJ-TextRCNN的古籍文本主题分类研究 被引量:1
2
作者 武帅 杨秀璋 +1 位作者 何琳 公佐权 《情报学报》 CSSCI CSCD 北大核心 2024年第5期601-615,共15页
以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人... 以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人文研究范式的转型。首先,参照东汉古籍《说文解字》对文字的分析方式,以前期标注的古籍语料数据集为基础,构建全新的“字音(说)-原文(文)-结构(解)-字形(字)”四维特征数据集。其次,设计四维特征向量提取模型(speaking,word,pattern,and font to vector,SWPF2vec),并结合预训练模型实现对古籍文本细粒度的特征表示。再其次,构建融合卷积神经网络、循环神经网络和多头注意力机制的古籍文本主题分类模型(dianji-recurrent convolutional neural networks for text classification,DJ-TextRCNN)。最后,融入四维语义特征,实现对古籍文本多维度、深层次、细粒度的语义挖掘。在古籍文本主题分类任务上,DJ-TextRCNN模型在不同维度特征下的主题分类准确率均为最优,在“说文解字”四维特征下达到76.23%的准确率,初步实现了对古籍文本的精准主题分类。 展开更多
关键词 多维特征融合 古籍文本 主题分类 SWPF2vec DJ-TextRCNN
下载PDF
基于主题感知和语义增强的作文自动评分方法
3
作者 陈宇航 杨勇 +4 位作者 先木斯亚·买买提明 帕力旦·吐尔逊 樊小超 任鸽 刁宇峰 《计算机工程》 CAS CSCD 北大核心 2024年第8期363-371,共9页
作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提... 作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提出一种基于主题感知和语义增强的作文自动评分模型。该模型采用多头注意力机制提取作文的浅层语义特征并感知作文主题特征,同时利用BERT的中间层句法特征和深层语义特征增强对作文语义的理解。在此基础上,融合不同维度的特征并用于作文自动评分。实验结果表明,该模型在公共数据集ASAP的8个子集上均表现出了显著的性能优势,相比于通义千问等基线模型,其能够有效提升作文自动评分性能,平均二次加权的卡帕值(QWK)达到80.25%。 展开更多
关键词 作文自动评分 语义增强 主题感知 特征融合 预训练语言模型
下载PDF
一期后路半椎体切除短节段融合术治疗先天性半椎体畸形的多中心研究
4
作者 黄琦 徐江龙 +7 位作者 宿玉玺 叶卫华 唐欣 陈顺有 周治国 赵占波 付桂兵 唐盛平 《临床小儿外科杂志》 CAS CSCD 北大核心 2024年第6期521-526,共6页
目的采用多中心研究方案,评价一期后路半椎体切除、短节段融合术治疗先天性半椎体畸形的效果。方法本研究为回顾性研究,参与单位包括深圳市儿童医院等6个医疗中心。2016年5月至2021年3月6个医疗中心共采用手术治疗单个胸椎或腰椎半椎体... 目的采用多中心研究方案,评价一期后路半椎体切除、短节段融合术治疗先天性半椎体畸形的效果。方法本研究为回顾性研究,参与单位包括深圳市儿童医院等6个医疗中心。2016年5月至2021年3月6个医疗中心共采用手术治疗单个胸椎或腰椎半椎体畸形所致先天性脊柱侧凸患儿35例,随访时间均在2年以上,均采用后路一期半椎体切除、短节段固定融合术。收集所有患儿一般资料,测量术前、术后及末次随访时冠状面主弯Cobb角、头侧代偿弯、尾侧代偿弯、冠状面平衡和矢状面节段性后凸角度以及并发症情况,评价手术效果。结果35例患儿中,男18例,女17例,其中半椎体位于第2至第10胸椎者10例,位于第11胸椎至第2腰椎者17例,位于第3至第5腰椎者8例。平均固定融合2.4个脊柱节段,手术年龄(4.5±2.6)岁,随访时间(42.6±17.6)个月;冠状面主弯Cobb角:术前为(37.6±9.0)°,术后为(9.0±6.4)°,末次随访时为(13.3±11.1)°。术后畸形矫正率为76.1%,末次随访时畸形矫正率为64.6%。头、尾侧代偿弯自行矫正率分别为44.4%和57.1%,节段性后凸矫正率为37.2%。术后及末次随访时的主弯、头侧代偿弯、尾侧代偿弯及节段性后凸角度与术前相比,差异均有统计学意义(P<0.05)。并发症:椎弓根切割4例(11.4%,4/35),畸形进展3例(8.6%,3/35),感染1例(2.9%,1/35),无一例神经系统并发症。结论后路一期半椎体切除、短节段融合术治疗单个胸椎或腰椎半椎体畸形所致先天性脊柱侧凸安全有效,能直接去除致畸原因,保留脊柱生长与活动功能,但需重点关注和积极预防椎弓根切割、畸形进展等术后并发症。 展开更多
关键词 脊柱侧凸 先天性 椎板切除术 脊柱融合术 治疗结果 多中心研究
下载PDF
融入类别标签和主题信息的用户兴趣识别方法
5
作者 康智勇 李弼程 林煌 《计算机科学》 CSCD 北大核心 2024年第S01期661-668,共8页
社交网络用户兴趣发现对信息过载缓解、个性化推荐和信息传播正向引导等方面具有重要意义。目前已有的兴趣识别研究未能同时考虑文本主题信息及其对应的类别标签信息对模型学习文本特征的帮助,文中提出了一种融入类别标签和主题信息的... 社交网络用户兴趣发现对信息过载缓解、个性化推荐和信息传播正向引导等方面具有重要意义。目前已有的兴趣识别研究未能同时考虑文本主题信息及其对应的类别标签信息对模型学习文本特征的帮助,文中提出了一种融入类别标签和主题信息的用户兴趣识别方法。首先,利用BERT预训练模型、BiLSTM模型和多头自注意力机制分别获取文本和标签序列的语义特征;其次,引入标签注意力机制,使模型更加关注文本与其类别标签更相关的词语信息;然后,利用LDA主题模型和Word2Vec模型得到文本主题特征;接着,设计门控机制进行特征融合,使模型能够自适应地融合多种特征,进而实现微博文本兴趣类别分类;最后,统计用户发表的所有文本在各个兴趣类别上的数量,将数量最多的兴趣类别确定为用户兴趣识别结果。为验证所提方法的有效性,文中构建了一个微博兴趣识别数据集。实验结果表明,该模型在微博文本兴趣类别分类和用户兴趣识别任务中均取得了最优性能。 展开更多
关键词 社交网络 兴趣识别 主题模型 标签注意力机制 特征融合
下载PDF
基于异构图神经网络的半监督网站主题分类
6
作者 王谢中 陈旭 +1 位作者 景永俊 王叔洋 《计算机工程与科学》 CSCD 北大核心 2024年第4期635-646,共12页
互联网网站数量快速增长使现有方法难以准确分类特定网站主题,如基于URL的方法无法处理未反映在URL中的主题信息,基于网页内容的方法受到数据稀疏性和语义关系捕捉的限制。为此,提出一种基于异构图神经网络的半监督网站主题分类方法HGNN... 互联网网站数量快速增长使现有方法难以准确分类特定网站主题,如基于URL的方法无法处理未反映在URL中的主题信息,基于网页内容的方法受到数据稀疏性和语义关系捕捉的限制。为此,提出一种基于异构图神经网络的半监督网站主题分类方法HGNN-SWT。该方法不仅利用网站文本特征来弥补仅使用URL特征的不足,还利用异构图对网站文本和词语的稀疏关系进行建模,通过处理图中的节点和边关系来提高分类性能。同时引入基于随机游走的邻居节点采样方法,考虑节点的局部特征和全局图结构,并提出特征融合策略,捕捉网站文本数据的上下文关系和特征交互。通过在自制的Chinaz Website数据集上的实验,证明了HGNN-SWT方法在网站主题分类任务中相较于现有方法具有更高的准确率。 展开更多
关键词 网站主题 异构图神经网络 半监督 特征融合
下载PDF
多维特征融合的混合神经网络文本情感分析模型 被引量:3
7
作者 袁健 董光文 《小型微型计算机系统》 CSCD 北大核心 2023年第10期2137-2143,共7页
针对复杂文本评论的情感分析研究存在着隐式主题方面分类不精确、文本特征提取不全面和识别文本上下文语义不足等问题,论文提出了一种多维特征融合的混合神经网络文本情感分析模型MFF-HNN.该模型先把词向量、词性、位置和句法依存特征... 针对复杂文本评论的情感分析研究存在着隐式主题方面分类不精确、文本特征提取不全面和识别文本上下文语义不足等问题,论文提出了一种多维特征融合的混合神经网络文本情感分析模型MFF-HNN.该模型先把词向量、词性、位置和句法依存特征进行注意力特征融合,抽取出主题词库,然后把融合特征输入到改进的TBGRU模型和DCNN模型中获取语义信息和局部特征信息,再与主题词库结合进行注意力特征融合语义特征信息,最后使用SoftMax函数获取文本方面级情感分类信息.实验表明,该模型的情感分类的效果优于其它模型. 展开更多
关键词 特征融合 主题提取 情感分析 注意力机制 方面级
下载PDF
基于局部特征和全局特征融合的微博情感分析
8
作者 胥桂仙 陈思瑾 +2 位作者 孟月婷 张廷 于绍娜 《中南民族大学学报(自然科学版)》 CAS 北大核心 2023年第4期526-534,共9页
目前的神经网络一般只将词粒度层面的词向量作为输入,忽略了语义层面的全局语义特征.针对此问题,提出了一种基于局部特征和全局特征融合的情感分类方法,以解决评论特征稀疏和主题聚焦性差的问题.对于局部特征,选择基于情感词典和BiLSTM... 目前的神经网络一般只将词粒度层面的词向量作为输入,忽略了语义层面的全局语义特征.针对此问题,提出了一种基于局部特征和全局特征融合的情感分类方法,以解决评论特征稀疏和主题聚焦性差的问题.对于局部特征,选择基于情感词典和BiLSTM神经网络模型提取基于词向量的文本特征.对于文本集的全局主题特征,采用神经主题模型提取文本主题特征,并将其作为全局特征来表示短文本信息.最终将基于局部加权词向量的文本特征和基于神经主题模型的文本主题特征进行拼接,并通过Softmax层输出,完成文本情感分类.结果表明:融合全局主题语义和局部加权词向量可以更加丰富神经网络的特征,从而有效地提高情感分类的准确率. 展开更多
关键词 情感分析 特征融合 神经主题模型 词向量
下载PDF
科学—技术—项目联动视角下颠覆性技术识别研究 被引量:6
9
作者 谭晓 西桂权 +3 位作者 苏娜 李佳娱 李辉 靳晓宏 《情报杂志》 CSSCI 北大核心 2023年第2期82-91,共10页
[研究目的]以典型案例为切入点,从创新过程视角探讨颠覆性技术演化特征,提出一种颠覆性技术早期识别的方法。[研究方法]基于技术演进对颠覆性技术典型案例进行特征分析,构建科学-技术-市场模型,基于模型构建对应的论文、专利、项目主题... [研究目的]以典型案例为切入点,从创新过程视角探讨颠覆性技术演化特征,提出一种颠覆性技术早期识别的方法。[研究方法]基于技术演进对颠覆性技术典型案例进行特征分析,构建科学-技术-市场模型,基于模型构建对应的论文、专利、项目主题网络,辅以相关政策分析,以人工智能领域进行实证。[研究结论]通过案例分析得到颠覆性技术的特点:经历从实验室到应用的发展,需在较短时间完成迭代扩张;颠覆性技术具有异轨性,是不断动态完善的创新技术;颠覆性技术来源于基础理论创新或技术突破、跨领域的技术应用、多项技术集成创新,是相对于领域的新技术;颠覆性技术产品满足了新的应用场景,具有主流技术产品不具备的功能。通过实证分析得到:从演化视角整体看,人工智能领域的颠覆性技术应用场景出现在医疗、交通等领域;面向重大需求的主题方向更强调在“人机融合智能”领域的重点攻关;关注应用层共性技术,突出表现为人工智能技术在具体行业领域的应用。 展开更多
关键词 颠覆性技术 技术识别 科学-技术-项目联动模型 主题关联 共现-主题模型融合
下载PDF
氨甲环酸不同使用方式对单节段后入路腰椎椎体融合术患者的治疗效果
10
作者 高文瑞 董乐乐 《包头医学院学报》 CAS 2023年第8期44-47,67,共5页
目的:研究氨甲环酸不同使用方式对行单节段后入路腰椎椎体融合术患者的影响。方法:将接受后入路腰椎椎体融合术(PLIF)治疗的患者90例分成A、B、C 3个组,每组各30例。A组在术前15 min静注100 mL氨甲环酸(TXA)溶液(15 mg/kg TXA:100 mL 0.... 目的:研究氨甲环酸不同使用方式对行单节段后入路腰椎椎体融合术患者的影响。方法:将接受后入路腰椎椎体融合术(PLIF)治疗的患者90例分成A、B、C 3个组,每组各30例。A组在术前15 min静注100 mL氨甲环酸(TXA)溶液(15 mg/kg TXA:100 mL 0.9%NaCl溶液),B组患者于缝合深筋膜前,用20 mL TXA溶液(1 g TXA:20 mL 0.9%NaCl溶液)浸泡创面5 min,冲洗后单侧留置引流管,C组患者留置引流管后沿引流管向切口内注入20 mL TXA溶液(1 g TXA:20 mL 0.9%NaCl溶液)。观察各组临床指标及术后并发症发生情况。结果:(1)血红蛋白与红细胞压积比较:术后1 d时A组高于B、C组(P<0.05);术后3 d时C组高于A、B组(P<0.05);(2)总失血量、术后引流量、隐性失血量比较:C组低于A、B两组(P<0.05);(3)术中失血量比较:A组低于B、C组(P<0.05);(4)术后1、3 d的D-二聚体、凝血五项比较:差异无统计学意义(P>0.05);(5)术后并发症发生情况比较:差异无统计学意义(P>0.05)。结论:行单节段PLIF术后的患者局部应用TXA联合引流管夹闭1 h的方式能减少患者围手术期总失血量、术后引流量和隐性失血量且安全性与传统静脉滴注相当,值得临床推广。 展开更多
关键词 氨甲环酸 失血量 后入路腰椎椎体融合术 静脉滴注 局部应用
下载PDF
融媒体时代传统媒体从业人员转型研究 被引量:1
11
作者 扈美荣 《江苏科技信息》 2023年第7期48-51,共4页
融媒体时代传播特点发生了很大变化,大量传统媒体从业人员面临转型的问题,传统媒体从业人员应适应融媒体时代要求,掌握融媒体传播特点和传播技能。文章认为,融媒体时代,传统媒体从业人员的新闻素养仍然需要,需在此基础上适应融媒体的传... 融媒体时代传播特点发生了很大变化,大量传统媒体从业人员面临转型的问题,传统媒体从业人员应适应融媒体时代要求,掌握融媒体传播特点和传播技能。文章认为,融媒体时代,传统媒体从业人员的新闻素养仍然需要,需在此基础上适应融媒体的传播特点,学会从海量繁杂、内容多样的网络信息中筛选出有价值新闻信息,掌握融合新闻H5、动画和短视频等多媒体报道方式,要善于从网络信息中发现议题、设置议题,引导正确舆论导向。 展开更多
关键词 融媒体 传统媒体 新闻素养 融合新闻 设置议题
下载PDF
基于深度学习的主题识别研究
12
作者 李清旭 张琛 成雪 《电脑与信息技术》 2023年第1期11-14,共4页
针对传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出了一种基于ERNIE和特征融合的主题识别方法.首先,针对传统词嵌入模型(Word2Vec)的词向量表示无法很好保留词在语句的信息及其多义性的问题,采用ERNIE能在增强... 针对传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出了一种基于ERNIE和特征融合的主题识别方法.首先,针对传统词嵌入模型(Word2Vec)的词向量表示无法很好保留词在语句的信息及其多义性的问题,采用ERNIE能在增强词表示能力的同时,有效解决词语的歧义问题;ERNIE也能在保留词语上下文语义的同时,根据词的多义性进行调整;其次,在训练过程中采用区分微调的方式将ERNIE模型最后编码层的输出特征作为CNN-Bi LSTM-Attention并行模型的输入,最大程度地保留新闻文本长距离词之间的语义信息,更高效的完成新闻主题识别任务。通过实验对比,验证了本文主题识别模型在acc和F1等多项指标上的优越识别性能。 展开更多
关键词 主题识别 特征融合 语义知识 ERNIE
下载PDF
基于事件框架的主题事件融合研究 被引量:6
13
作者 许荣华 吴刚 +1 位作者 李培峰 朱巧明 《计算机应用研究》 CSCD 北大核心 2009年第12期4542-4545,共4页
针对事件抽取获得的单个元事件无法完整描述主题事件的特点,提出了一种主题事件的融合方法,通过该方法将与同一主题相关的所有元事件整合在一起,以层次化的形式表示。首先定义了一种事件融合框架TEFF(topic event fusion framework)。... 针对事件抽取获得的单个元事件无法完整描述主题事件的特点,提出了一种主题事件的融合方法,通过该方法将与同一主题相关的所有元事件整合在一起,以层次化的形式表示。首先定义了一种事件融合框架TEFF(topic event fusion framework)。该框架根据各类元事件在主题事件中的作用,将主题事件以层次化的形式表示。同时给出元事件和主题的相关度计算方法,通过该算法来评价元事件和主题的相关度。在TEFF的指导下,通过相关度计算,实现主题事件的融合。在以2008年起的金融危机为主题的实验中,取得了F值为77.1%的实验结果,这表明该方法能有效地对主题事件进行融合。 展开更多
关键词 事件框架 主题事件融合 事件信息抽取
下载PDF
面向多源知识融合的扩展主题图相似性算法 被引量:10
14
作者 鲁慧民 冯博琴 李旭 《西安交通大学学报》 EI CAS CSCD 北大核心 2010年第2期20-24,共5页
针对基于元数据或传统主题图的知识组织模式没有实现知识的多层次多粒度表示,以及知识融合过程中相似性算法准确性不高而影响融合质量的问题,结合全信息理论与扩展主题图结构特点及语义信息,提出了面向多源知识融合的扩展主题图相似... 针对基于元数据或传统主题图的知识组织模式没有实现知识的多层次多粒度表示,以及知识融合过程中相似性算法准确性不高而影响融合质量的问题,结合全信息理论与扩展主题图结构特点及语义信息,提出了面向多源知识融合的扩展主题图相似性算法(ETMSC)和阈值选取的相关性、层次对应和实验确定三原则.该算法综合了语法、语义和语用的相似性,扩展了主题图元素间组成结构上的相似性,同时充分考虑了涵义及所处语境的相似性.主题图相似性的判别准则与阈值有关,阈值的确定与数据集相关.实验结果表明,ETMSC算法与单纯基于语法或语义的相似性算法相比,准确性提高了9.2%~11.1%. 展开更多
关键词 知识融合 主题图 相似性算法
下载PDF
一种基于扩展主题图的分布式知识融合 被引量:6
15
作者 鲁慧民 冯博琴 +2 位作者 赵英良 郑庆华 刘均 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2009年第3期543-547,共5页
针对知识融合的效率问题,扩展了传统主题图的组织结构,并在此基础上构建一种基于扩展主题图的分布式知识融合体系结构,提出一种基于全信息的主题图相似度算法,设计了扩展主题图融合的规则和算法,充分考虑了比较元素的涵义和所处语境,提... 针对知识融合的效率问题,扩展了传统主题图的组织结构,并在此基础上构建一种基于扩展主题图的分布式知识融合体系结构,提出一种基于全信息的主题图相似度算法,设计了扩展主题图融合的规则和算法,充分考虑了比较元素的涵义和所处语境,提高了相似度算法的准确性,实现了分布式环境下知识的有效融合. 展开更多
关键词 知识融合 主题图 知识元 相似性算法
下载PDF
基于多元关系融合的科技文本主题识别方法研究 被引量:10
16
作者 许海云 武华维 +2 位作者 罗瑞 董坤 李婧 《中国图书馆学报》 CSSCI 北大核心 2019年第1期82-94,共13页
当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展... 当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展现了主题关联关系。因此,本文根据主题词之间语义关系距离的远近,将主题识别中主题词关联分为基础关系、强化关系和新增关系,在此基础上提出面向主题识别的多元关系抽取及关系融合方法;并以基因工程疫苗的研发与制备领域为例进行领域实证分析,利用PathSelClus算法实现基于多元关系融合的主题聚类,通过对比实验证明多元关系融合可以有效提高实证领域的文本主题聚类效果,而未来多关系融合主题识别则是需要重点关注的问题。图4。表6。参考文献19。 展开更多
关键词 文本主题识别 多元关系 数据融合 关系融合 主题聚类
下载PDF
基于潜在主题融合的跨媒体图像语义标注 被引量:5
17
作者 刘杰 杜军平 《电子学报》 EI CAS CSCD 北大核心 2014年第5期987-991,共5页
图像语义标注是图像语义分析研究中的一个重要问题.在主题模型的基础上,本文提出一种新颖的跨媒体图像标注方法来进行图像间语义的传播.首先,对训练图像使用主题模型,抽取视觉模态和文本模态信息的潜在语义主题.然后,通过使用一个权重... 图像语义标注是图像语义分析研究中的一个重要问题.在主题模型的基础上,本文提出一种新颖的跨媒体图像标注方法来进行图像间语义的传播.首先,对训练图像使用主题模型,抽取视觉模态和文本模态信息的潜在语义主题.然后,通过使用一个权重参数来融合两种模态信息的主题分布,从而学习到一种融合主题分布.最后,在融合主题分布的基础上训练一个标注模型来给目标图像赋予合适的语义信息.在标准的MSRC和Corel5K数据集上将提出的方法与最近著名的标注方法进行比较实验.标注性能的详细评价结果表明提出方法的有效性. 展开更多
关键词 图像语义标注 跨媒体 主题模型 加权融合
下载PDF
多特征融合文本聚类的新闻话题发现模型 被引量:10
18
作者 车蕾 杨小平 《国防科技大学学报》 EI CAS CSCD 北大核心 2017年第3期85-90,共6页
融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量... 融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量空间模型及相似度算法,基于潜在狄利克雷分配模型构建主题空间模型及相似度算法,针对命名实体构建命名实体模型及相似度算法,并将三种相似度算法形成最优融合。基于多特征融合文本聚类方法,模型改进了用于新闻话题发现的Single-Pass算法。实验是在真实新闻数据集上开展的,实验结果表明:该模型有效地提高了新闻话题发现的准确率、召回率和综合评价指标,并具有一定的自适应能力。 展开更多
关键词 新闻话题 多特征融合 潜在狄利克雷分配 向量空间模型 主题空间模型
下载PDF
一种基于LDA模型的主题句抽取方法 被引量:10
19
作者 王力 李培峰 朱巧明 《计算机工程与应用》 CSCD 2013年第2期160-164,257,共6页
在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题... 在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题概率分布的平滑度进行候选句的可信度计算来抽取主题句。在面向Web的主题句抽取的具体应用中,取得了较好的效果。 展开更多
关键词 隐含狄利克雷分配(LDA) 主题模型 主题句抽取 信息融合
下载PDF
基于主题模型和词向量融合的微博文本主题聚类研究 被引量:25
20
作者 颜端武 梅喜瑞 +1 位作者 杨雄飞 朱鹏 《现代情报》 CSSCI 2021年第10期67-74,共8页
[目的/意义]针对微博短文本数据存在的高维稀疏和上下文语义缺失等问题,提出一种融合主题模型和词向量的文本特征表达方式,以期提高微博主题聚类的效果。[方法/过程]以新浪微博为数据源,结合LDA文档—主题分布特征和加权Word2Vec词向量... [目的/意义]针对微博短文本数据存在的高维稀疏和上下文语义缺失等问题,提出一种融合主题模型和词向量的文本特征表达方式,以期提高微博主题聚类的效果。[方法/过程]以新浪微博为数据源,结合LDA文档—主题分布特征和加权Word2Vec词向量特征构建微博短文本的融合特征,基于K-means算法进行主题聚类,并与单一特征聚类、标准LDA主题模型的实验结果进行对比,根据F1值评估主题聚类方法的优劣。[结果/结论]相较于其他方法,融合特征主题聚类模型表现最佳,其F1值达到83.7%。实验表明,融合特征能够更加全面、准确地描述文本的语义信息,能更有效地表征微博文本。 展开更多
关键词 微博主题聚类 LDA主题模型 Word2Vec 特征融合 K-MEANS
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部