期刊文献+
共找到151篇文章
< 1 2 8 >
每页显示 20 50 100
网络问答社区用户提问主题聚类图谱构建研究
1
作者 杨艳妮 廖栩君 +2 位作者 闵锦涛 黄正伟 刘华媛 《晋图学刊》 2023年第5期18-28,共11页
面向网络问答社区海量问题内容组织的现实需求,针对用户提问的文本特点对其进行多层次主题聚类与图谱构建。通过充分融合Glove和Word2vec算法的优势,对用户提问进行文本特征表示。在此基础上利用不同聚类算法对用户提问进行多层次聚类,... 面向网络问答社区海量问题内容组织的现实需求,针对用户提问的文本特点对其进行多层次主题聚类与图谱构建。通过充分融合Glove和Word2vec算法的优势,对用户提问进行文本特征表示。在此基础上利用不同聚类算法对用户提问进行多层次聚类,并利用TextRank生成聚类标签,然后基于主题间层次结构,利用图模型将不同提问文本的关联关系呈现出来,从而构建网络问答社区用户提问主题聚类图谱,以此提升网络问答社区平台知识资源的组织与利用效率,为知识查询和推荐提供索引。 展开更多
关键词 网络问答社区 用户提问 主题图谱 主题聚类
下载PDF
基于Doc2Vec增强特征的长文本主题聚类研究
2
作者 陈洁 《计算机科学》 CSCD 北大核心 2023年第S01期211-216,共6页
针对新闻长文本语义表征的难点,基于Doc2Vec文档嵌入和词向量加权方式构建增强的特征表示。利用DV-sim方法和DV-tfidf方法从文档首尾部分特定词性的内容中提取增强特征,再分别与Doc2Vec文档向量组合,形成新的全局表征。DV-sim从语义角度... 针对新闻长文本语义表征的难点,基于Doc2Vec文档嵌入和词向量加权方式构建增强的特征表示。利用DV-sim方法和DV-tfidf方法从文档首尾部分特定词性的内容中提取增强特征,再分别与Doc2Vec文档向量组合,形成新的全局表征。DV-sim从语义角度,采用特征词与Doc2Vec向量的相似度获得词权重;DV-tfidf从词频统计角度,采用词频-逆文档频率方式获得词权重,然后利用HDBSCAN算法在THUCNews和Sogou数据集上进行主题聚类。相比直接应用Doc2Vec向量,DV-sim在两个数据集上的噪声数分别减少60.82%和60.63%,准确率提高12.14%和20.58%,F1-Score值提高15.61%和11.58%;DV-tfifd在两个数据集上的噪声数分别减少15.20%和59.55%,准确率提高10.85%和17.93%,F1-Score值提高15.60%和9.21%。实验结果表明,DV-sim和DV-tfidf都可以提高主题聚类性能,且基于语义的增强特征比基于词频的效果更好,DV-sim在优秀女性人物报道的主题聚类上也得到了有效应用。 展开更多
关键词 主题聚类 文本表征 Doc2Vec 词向量 HDBSCAN
下载PDF
基于LDA模型的新冠肺炎疫情微博用户主题聚类图谱及主题传播路径研究 被引量:39
3
作者 张柳 王晰巍 +1 位作者 黄博 刘婷艳 《情报学报》 CSSCI CSCD 北大核心 2021年第3期234-244,共11页
本文构建“日本钻石邮轮”舆情话题微博用户的主题聚类图谱和对网络社群间主题传播路径进行分析,可以更好地识别微博用户主题特征和意见领袖,从而帮助舆情监管部门对舆情进行更为有效的引导和监管。本文基于LDA(latent Dirichlet alloca... 本文构建“日本钻石邮轮”舆情话题微博用户的主题聚类图谱和对网络社群间主题传播路径进行分析,可以更好地识别微博用户主题特征和意见领袖,从而帮助舆情监管部门对舆情进行更为有效的引导和监管。本文基于LDA(latent Dirichlet allocation)模型构建新冠肺炎疫情事件下微博用户的主题聚类图谱,利用困惑度评价指标来确定微博用户的最优主题数和主题分布;利用网络用户转发评论关系构建微博用户主题聚类图谱,提出网络社群间主题传播路径分析方法。本文结合“日本钻石公主号邮轮”这一全球新冠肺炎疫情期间的重要舆情话题,进行微博用户群体主题的确定、主题意见领袖的识别以及该话题下的网络社群间主题传播路径分析。研究结果表明,基于LDA模型可进行网络群体主题识别,并发现衍生的舆情话题,通过意见领袖识别可更好地进行舆情引导,利用网络社群的主题传播路径分析可进行话题推送,从而实现对舆情更好地引导及网络生态治理。 展开更多
关键词 LDA 新冠肺炎 微博用户 主题聚类 传播路径
下载PDF
基于社会网络的学科主题聚类研究 被引量:12
4
作者 朱梦娴 程齐凯 陆伟 《情报杂志》 CSSCI 北大核心 2012年第11期40-44,39,共6页
将社会网络分析的方法运用到学科主题聚类中,对从CNKI上采集的发文数据构建关键词共词网络,再用Blondel社区发现算法进行关键词聚类分析,接着用Z-value对划分的社区进行核心圈分析。最后,笔者选取三个适当的例子对聚类算法和核心圈的结... 将社会网络分析的方法运用到学科主题聚类中,对从CNKI上采集的发文数据构建关键词共词网络,再用Blondel社区发现算法进行关键词聚类分析,接着用Z-value对划分的社区进行核心圈分析。最后,笔者选取三个适当的例子对聚类算法和核心圈的结果进行评价,得到:Blondel社区发现算法虽然存在一些缺陷,但在数量和质量上都效果不错;Z-value确定社区核心圈效果很好,核心节点能很好地表征社区内容。在此基础上,笔者得出了图书情报学领域的主题聚类结果。 展开更多
关键词 学科主题聚类 社会网络 社区发现 Z-VALUE 核心圈
下载PDF
基于主题聚类的学科研究热点及其趋势监测方法 被引量:20
5
作者 章成志 梁勇 《情报学报》 CSSCI 北大核心 2010年第2期342-349,共8页
常规的学科热点及趋势监测方法存在监测成本高、监测信息相对滞后等问题。因此需要寻求较低成本、较快速的方法进行学科热点和趋势的监测,以保证监测系统提供信息的时效性。本文以图书情报档案学科为例,依据学科学术论文全文,从主题... 常规的学科热点及趋势监测方法存在监测成本高、监测信息相对滞后等问题。因此需要寻求较低成本、较快速的方法进行学科热点和趋势的监测,以保证监测系统提供信息的时效性。本文以图书情报档案学科为例,依据学科学术论文全文,从主题角度对学术论文集合进行全面分析,即:采用主题聚类方法,对包括时间信息的学科学术全文进行主题分析与主题聚类,归纳出某一特定学科的研究热点和这些热点的发展趋势。实验结果表明,基于主题聚类的学科热点及其趋势监测方法,其监测结果在很大程度上接近于常规方法的监测结果,但基于主题聚类的监测方法,在监测成本和监测信息时效方面得到改善。 展开更多
关键词 学科热点监测 主题聚类 主题抽取 文本
下载PDF
基于主题模型和词向量融合的微博文本主题聚类研究 被引量:21
6
作者 颜端武 梅喜瑞 +1 位作者 杨雄飞 朱鹏 《现代情报》 CSSCI 2021年第10期67-74,共8页
[目的/意义]针对微博短文本数据存在的高维稀疏和上下文语义缺失等问题,提出一种融合主题模型和词向量的文本特征表达方式,以期提高微博主题聚类的效果。[方法/过程]以新浪微博为数据源,结合LDA文档—主题分布特征和加权Word2Vec词向量... [目的/意义]针对微博短文本数据存在的高维稀疏和上下文语义缺失等问题,提出一种融合主题模型和词向量的文本特征表达方式,以期提高微博主题聚类的效果。[方法/过程]以新浪微博为数据源,结合LDA文档—主题分布特征和加权Word2Vec词向量特征构建微博短文本的融合特征,基于K-means算法进行主题聚类,并与单一特征聚类、标准LDA主题模型的实验结果进行对比,根据F1值评估主题聚类方法的优劣。[结果/结论]相较于其他方法,融合特征主题聚类模型表现最佳,其F1值达到83.7%。实验表明,融合特征能够更加全面、准确地描述文本的语义信息,能更有效地表征微博文本。 展开更多
关键词 微博主题聚类 LDA主题模型 Word2Vec 特征融合 K-MEANS
下载PDF
国内甲骨文研究热点、主题聚类及研究状况分析——基于共词和社会网络分析视角 被引量:6
7
作者 张瑞红 《河南师范大学学报(自然科学版)》 CAS 北大核心 2020年第6期31-38,共8页
为客观反映我国近20年甲骨文领域的研究状况,以CNKI收录的甲骨文研究的期刊论文为研究对象,采用共词分析方法,从整体网、群体和成员3个维度分析共词网络,识别甲骨文研究热点;采用社会网络分析方法划分出5个凝聚子群,通过多维尺度分析验... 为客观反映我国近20年甲骨文领域的研究状况,以CNKI收录的甲骨文研究的期刊论文为研究对象,采用共词分析方法,从整体网、群体和成员3个维度分析共词网络,识别甲骨文研究热点;采用社会网络分析方法划分出5个凝聚子群,通过多维尺度分析验证子群的合理性,在该领域研究人员帮助下归纳研究主题,并运用战略坐标图分析研究主题的发展现状.研究发现,甲骨文研究热点词基本上与子群2重叠,子群2以古文字形体构造为研究主题,处于甲骨文研究领域的核心,研究趋于成熟,理论体系完善,为子群1的殷商甲骨文研究提供了方法和技术支持;甲骨文书法研究、考释和大辛庄甲骨文研究、古文字起源演变研究,这3个研究主题处于边缘且不太成熟. 展开更多
关键词 甲骨文 主题聚类 研究状况 共词分析 社会网络分析
下载PDF
知识发现系统的相关性排序与主题聚类功能问题探析 被引量:4
8
作者 王连喜 《图书馆工作与研究》 CSSCI 北大核心 2015年第12期56-60,共5页
文章以Primo、EDS和Summon 3种较为常用的发现系统为分析对象,总结发现系统检索结果的相关性排序与主题聚类功能的基本原理和特点,进而就检索结果在相关性排序及主题聚类功能拓展方面所面临的用户满意度提升问题、主题聚类数量划分问题... 文章以Primo、EDS和Summon 3种较为常用的发现系统为分析对象,总结发现系统检索结果的相关性排序与主题聚类功能的基本原理和特点,进而就检索结果在相关性排序及主题聚类功能拓展方面所面临的用户满意度提升问题、主题聚类数量划分问题、多语言检索排序问题,以及资源的智能化推荐问题展开讨论,并针对存在的问题提出解决思路。 展开更多
关键词 知识发现系统 相关性排序 主题聚类 多语言 PRIMO EDS SUMMON
原文传递
语义场主题聚类呈现对大学英语词汇习得的影响研究 被引量:2
9
作者 倪玉琴 许洁 周忠浩 《江苏高职教育》 2020年第2期69-74,共6页
通过语义场主题聚类和词表顺序两种词汇呈现方式,进行教学对比实验,以测量二者对大学英语词汇习得的影响效应。研究表明:词表顺序呈现方式在词汇语义初学中稍显优势,但在语篇意识和语用修辞方面则与语义场主题聚类呈现方式存在显著差异... 通过语义场主题聚类和词表顺序两种词汇呈现方式,进行教学对比实验,以测量二者对大学英语词汇习得的影响效应。研究表明:词表顺序呈现方式在词汇语义初学中稍显优势,但在语篇意识和语用修辞方面则与语义场主题聚类呈现方式存在显著差异。相比前者,主题聚类呈现可以有效促进词汇语义横组合联想,为学习者建构语言图式结构和篇章结构提供支架,有助于提升综合语言能力。研究提出大学英语教学改革中,可打破教材结构,采取词表顺序和语义场主题聚类相耦合的词汇呈现教学方法。 展开更多
关键词 语义场 主题聚类 大学英语 词汇习得
下载PDF
我国民族职业教育研究热点与主题聚类——基于科学知识图谱的实证分析 被引量:4
10
作者 安旺国 《职业技术教育》 北大核心 2016年第24期29-35,共7页
为进一步探析和评述国内民族职业教育研究进展,以中国知网(CNKI)1986—2016年收录的356篇民族职业教育研究文献为样本,运用知识图谱方法及可视化技术,分别从文献数量与年度分布、期刊来源与知识基础、核心作者与机构分布、关键词共现与... 为进一步探析和评述国内民族职业教育研究进展,以中国知网(CNKI)1986—2016年收录的356篇民族职业教育研究文献为样本,运用知识图谱方法及可视化技术,分别从文献数量与年度分布、期刊来源与知识基础、核心作者与机构分布、关键词共现与主题聚类等方面进行科学计量分析,揭示近30年来国内民族职业教育研究的现状、热点及发展趋势。在此基础上提出未来相关研究应加强科研合作,拓展研究视域、改进研究方法,加强研究的政策性与时效性等建议。 展开更多
关键词 民族职业教育 时空分布 共现分析 主题聚类
下载PDF
主题聚类式特藏建设初探——兼论西安交通大学“民国高等教育”特藏 被引量:6
11
作者 问书芳 《图书馆学刊》 2015年第6期48-50,共3页
目前在高校图书馆,特藏因其在彰显高校文化传统和馆藏特色的重要价值而备受重视。主题聚类式特藏是以某一主题为中心将分散的文献集中,具有集聚性、主题性及完备性、特色性等特征。通过对西安交通大学图书馆"民国高等教育"特... 目前在高校图书馆,特藏因其在彰显高校文化传统和馆藏特色的重要价值而备受重视。主题聚类式特藏是以某一主题为中心将分散的文献集中,具有集聚性、主题性及完备性、特色性等特征。通过对西安交通大学图书馆"民国高等教育"特藏建设思路、排架方式以及特藏利用的个案分析,对图书馆特藏建设提供有益的启示。 展开更多
关键词 民国高等教育 主题聚类 特藏建设
下载PDF
基于WBLDA的学术文献摘要主题聚类 被引量:2
12
作者 潘晓英 伍哲 +1 位作者 陈柳 杨芳 《计算机应用研究》 CSCD 北大核心 2020年第8期2273-2278,2283,共7页
为使科研人员节省时间,高效阅读学术文献信息,提出一种学术文献摘要的主题聚类模型——优化主题数目作者层主题聚类模型(WBLDA)。首先在预处理阶段,自定义符合学术文献摘要特点的分词词典和停用词词典,解决学术文献摘要分词不准确的问题... 为使科研人员节省时间,高效阅读学术文献信息,提出一种学术文献摘要的主题聚类模型——优化主题数目作者层主题聚类模型(WBLDA)。首先在预处理阶段,自定义符合学术文献摘要特点的分词词典和停用词词典,解决学术文献摘要分词不准确的问题;在特征提取阶段,提出增大词频特征提取方法(ITF-IDF),使用词频放大法来增大词频,弱化文本长度对特征权重的影响,提取出更加符合学术文献摘要方向的特征词;最后,针对传统主题模型忽略作者这一重要属性的缺点,在主题聚类模型中引入学术文献摘要的作者信息,构建文档—主题+作者—词的WBLDA模型,同时使用贝叶斯准则优化主题聚类模型的主题数。通过对学术文献摘要数据集仿真实验结果表明,与TF-IDF相比,ITF-IDF方法的特征提取准确率更高;与LDA相比,WBLDA模型的聚类纯度和F-score值也更高,选择出的主题更加准确,更能代表摘要的学术方向。 展开更多
关键词 主题聚类 增大词频特征提取法 优化主题数目作者层主题聚类模型 贝叶斯准则
下载PDF
基于CLSVSM的惩罚性矩阵分解及其在文本主题聚类中的应用
13
作者 牛奉高 冯世佳 黄琛 《计算机与现代化》 2021年第5期66-72,共7页
文本信息的合理表示对文本主题聚类及检索有重要作用。针对文本表示模型维度较高的问题,基于共现潜在语义向量空间模型(CLSVSM)研究惩罚性矩阵分解(PMD),利用PMD对向量进行稀疏约束,提取核心特征词,进而实现原始数据的重建;通过共现分... 文本信息的合理表示对文本主题聚类及检索有重要作用。针对文本表示模型维度较高的问题,基于共现潜在语义向量空间模型(CLSVSM)研究惩罚性矩阵分解(PMD),利用PMD对向量进行稀疏约束,提取核心特征词,进而实现原始数据的重建;通过共现分析理论及PMD方法,深度挖掘特征词之间的语义信息,构建语义核函数(PMD_K)。将本文方法应用于文本主题聚类中,实验结果显示,PMD和PMD_K这2种方法的聚类效果均明显优于其他方法,以F值为例,PMD_K方法较以往的95%CLSVSM_K方法,F值提高了21.9%。将PMD与文本表示模型相结合,在提高了文本主题聚类的效率和精度的同时,还避免了对高维矩阵的复杂运算。 展开更多
关键词 CLSVSM 惩罚性矩阵分解 语义核函数 文本主题聚类
下载PDF
使用多元语义特征的评论文本主题聚类 被引量:1
14
作者 李亚红 王素格 李德玉 《计算机工程与应用》 CSCD 2013年第2期188-193,共6页
特征是一切观点挖掘和情感分析任务的关键所在。对于无监督的文本聚类任务,文本特征的优劣直接影响聚类效果。考察三种语义特征(名词、名词短语、语义角色)对主题聚类的作用以及不同特征之间的相容关系,提出一种消除冗余特征的方法。该... 特征是一切观点挖掘和情感分析任务的关键所在。对于无监督的文本聚类任务,文本特征的优劣直接影响聚类效果。考察三种语义特征(名词、名词短语、语义角色)对主题聚类的作用以及不同特征之间的相容关系,提出一种消除冗余特征的方法。该方法能有效地去除冗余特征,提高聚类精度。同时还提出一种基于语义角色标注的直接定位有效词特征的聚类方法,实验表明该方法是直接的和有效的,并为特征选择方法提供了新思路。 展开更多
关键词 文本主题聚类 名词特征 短语特征 语义角色特征 相容关系
下载PDF
可预测性灾害中网民情感态度引导策略研究——基于情感演化趋势及主题聚类的分析 被引量:1
15
作者 沈洪洲 马巧慧 沈超 《电子商务》 2020年第5期39-42,共4页
可预测性灾害的网络舆情在灾前即已形成,研究其中网民情感态度的引导策略具有重要的现实意义。以"山竹"台风中普通网民发布的微博数据为具体对象,按灾前、灾中和灾后三个阶段分析网民情感态度的演变趋势,并利用主题聚类分析... 可预测性灾害的网络舆情在灾前即已形成,研究其中网民情感态度的引导策略具有重要的现实意义。以"山竹"台风中普通网民发布的微博数据为具体对象,按灾前、灾中和灾后三个阶段分析网民情感态度的演变趋势,并利用主题聚类分析探索不同情感态度背后的主题因素,最后提出可预测性灾害中网民情感态度引导策略的建议。研究发现,可预测性灾害中灾前和灾后阶段网民情感态度波动较大,存在引导空间。建议从灾前预警信息发布和灾害知识普及、应急物资供给保障、水电网设施的安全和抢修、社会化媒体平台的运用等方面完善网民情感态度的引导策略。 展开更多
关键词 可预测性灾害 网络舆情 情感分析 主题聚类
下载PDF
知识群落在文献资源动态主题聚类中的有效性
16
作者 徐汉青 王思茗 +1 位作者 孙熊兰 滕广青 《图书馆理论与实践》 CSSCI 2019年第11期69-74,共6页
文章将网络分析与时间序列分析相结合,基于社群发现算法和知识关联频度提取层次知识群落。从时间序列的层面,对层次知识群落在文献资源主题聚类中的有效性进行测算与验证。研究表明,层次知识群落能够凸现知识之间的强关系,能够有效表征... 文章将网络分析与时间序列分析相结合,基于社群发现算法和知识关联频度提取层次知识群落。从时间序列的层面,对层次知识群落在文献资源主题聚类中的有效性进行测算与验证。研究表明,层次知识群落能够凸现知识之间的强关系,能够有效表征文献资源的动态主题聚类。 展开更多
关键词 知识网络 主题聚类 知识群落 知识演化
下载PDF
青刺果德温特专利的专业性主题聚类
17
作者 陈一 《计算机时代》 2022年第7期33-35,共3页
专利文本会涉及不同学科领域的专业词汇。本文以青刺果德温特专利数据为例,研究专利的专业性主题聚类。运用Word2vec对青刺果德温特专利文本训练词向量,再用N-Gram改进TF-IDF优化加权,然后用LDA做主题聚类。结果显示,青刺果专利的研究... 专利文本会涉及不同学科领域的专业词汇。本文以青刺果德温特专利数据为例,研究专利的专业性主题聚类。运用Word2vec对青刺果德温特专利文本训练词向量,再用N-Gram改进TF-IDF优化加权,然后用LDA做主题聚类。结果显示,青刺果专利的研究热点主要集中在青刺果的功能、应用、提取技术和成分分析方面,种植和包装方面的相关专利需要加强。 展开更多
关键词 专业性主题聚类 青刺果德温特专利 Word2vec N-Gram-TF-IDF LDA
下载PDF
基于主题聚类的国内“区块链”研究主路径分析
18
作者 郭子榕 李秀霞 《江苏科技信息》 2021年第3期9-13,38,共6页
区块链研究属于新兴领域,具有发展迅速、研究内容相对浅显、研究范围宽泛等特点。为发现该领域的研究路径,帮助研究者在该方向精准把握研究选题,推动区块链研究的快速发展,文章在前人研究的基础上,提出一种基于主题聚类的区块链研究主... 区块链研究属于新兴领域,具有发展迅速、研究内容相对浅显、研究范围宽泛等特点。为发现该领域的研究路径,帮助研究者在该方向精准把握研究选题,推动区块链研究的快速发展,文章在前人研究的基础上,提出一种基于主题聚类的区块链研究主路径分析模型。通过利用网络python在中国知网抓取区块链研究领域的核心文献,经数据预处理后利用Citespace软件进行主题聚类,并按照聚类结果分别做出3条"区块链+主题"的主路径,识别其核心文献,绘制国内区块链研究的知识演化主路径。经研究,将主题聚类分析和主路径分析相结合,对基于引文网络连通性获取的主路径做了语义方面的补充,清晰地展示出区块链研究发展的演化路径和热点研究主题。 展开更多
关键词 主题聚类 主路径分析 区块链研究
下载PDF
基于连续词包模型的一种改进的文本主题聚类算法
19
作者 秦泽浩 《电脑知识与技术》 2018年第6Z期226-228,共3页
本文针对知乎网上问答文章的特点和信息处理方式,分析了使用连续词包模型对这种文本进行主题聚类的一般方式和步骤。包括文本预处理、文本处理的模型选择和聚类分析算法的设计。在本文预处理阶段,讨论了对于中文的分词和去噪等;在文本... 本文针对知乎网上问答文章的特点和信息处理方式,分析了使用连续词包模型对这种文本进行主题聚类的一般方式和步骤。包括文本预处理、文本处理的模型选择和聚类分析算法的设计。在本文预处理阶段,讨论了对于中文的分词和去噪等;在文本处理的模型选择阶段,本文着重讨论了N-gram语言模型;在文本聚类阶段,分析并描述了一种文本聚类算法。通过上述讨论分析确定了本文最终应用的方法。 展开更多
关键词 连续词包(Continuous Bag of Words) 文本主题聚类算法 改进K-MEANS
下载PDF
国际城市人工智能发展主题聚类分析及上海位势——基于论文和专利的分析
20
作者 王茜 樊宇航 《科学发展》 CAS 2024年第2期31-39,共9页
基于论文和专利的聚类分析,上海在智能医疗、智慧装备、智能检测等应用领域拥有比较优势,因此要扬长板,大力鼓励企业开展底层技术攻关和行业应用探索,推动形成有具有世界影响力和竞争力的产品。同时,也要看到差距,积极补短板,通过大学... 基于论文和专利的聚类分析,上海在智能医疗、智慧装备、智能检测等应用领域拥有比较优势,因此要扬长板,大力鼓励企业开展底层技术攻关和行业应用探索,推动形成有具有世界影响力和竞争力的产品。同时,也要看到差距,积极补短板,通过大学科技园、高质量孵化器等载体建设,技术经纪人等专业团队培育,持续探索形成人工智能技术与产业应用的融合点,形成特色应用优势,加快科研成果转化。 展开更多
关键词 人工智能 主题聚类 论文数据 专利数据
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部