期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于文本融合特征的突发事件子话题聚类研究
1
作者 芦子涵 郑中团 《智能计算机与应用》 2023年第10期45-51,55,共8页
突发事件具有突发性、公共性、传播范围广等特点,研究同一突发事件中更细粒度的子话题聚类,对舆情管控部门实现精准化管控具有重要意义。针对以往话题聚类方法忽略了同一事件下更细粒度的子话题聚类,且为了更有效地表达微博文本的语义信... 突发事件具有突发性、公共性、传播范围广等特点,研究同一突发事件中更细粒度的子话题聚类,对舆情管控部门实现精准化管控具有重要意义。针对以往话题聚类方法忽略了同一事件下更细粒度的子话题聚类,且为了更有效地表达微博文本的语义信息,提出一种基于LDA文档-主题分布与Doc2Vec句向量融合的文本特征表示方法与文本相似度计算方法,应用Single-Pass增量聚类算法实现同一突发事件下子话题聚类,并根据F1值与单一文本特征子话题聚类实验结果进行对比。结果表明,本文方法子话题聚类效果更佳,F1值为72.4%,表明该方法能够有效地表达文本特征,进而提高子话题聚类的准确度。 展开更多
关键词 突发事件 话题聚类 文本特征 LDA主题模型 Doc2Vec模型
下载PDF
网络舆情热点话题聚类方法研究 被引量:25
2
作者 张寿华 刘振鹏 《小型微型计算机系统》 CSCD 北大核心 2013年第3期471-474,共4页
主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点... 主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点,改善舆情信息采集策略;网络舆情的相关页面标题文字主题鲜明,据此提出自动挖掘热点关键词并根据关键词进行话题聚类的方法;根据新闻、论坛和博客的不同特点分别设计网络舆情热点分析模型.在此基础上,设计并实现了一个网络舆情监测系统.系统实际运行表明,该方案可以及时发掘热点话题并对突发事件实时追踪监测. 展开更多
关键词 网络舆情 话题聚类 热点话题 追踪监测
下载PDF
融合内容与时间特征的中文新闻子话题聚类 被引量:5
3
作者 仲兆满 李存华 +1 位作者 戴红伟 刘宗田 《计算机科学与探索》 CSCD 2013年第4期368-376,共9页
子话题是对话题的再次划分,是比话题粒度更细的新兴研究方向,子话题的聚类是话题内部演化关系分析的基础。提出了融合内容特征和时间特征的中文新闻子话题聚类方法,重点分析了子话题内容特征的表现规律,研究了子话题特征词的权重计算和... 子话题是对话题的再次划分,是比话题粒度更细的新兴研究方向,子话题的聚类是话题内部演化关系分析的基础。提出了融合内容特征和时间特征的中文新闻子话题聚类方法,重点分析了子话题内容特征的表现规律,研究了子话题特征词的权重计算和降维方法。选取5个话题的18个子话题进行了实验,结果表明,所提方法的性能与已有的子话题聚类方法相比有显著提高。 展开更多
关键词 话题演化 话题聚类 内容特征 时间特征
下载PDF
基于话题聚类及情感强度的中文微博舆情分析 被引量:27
4
作者 吴青林 周天宏 《情报理论与实践》 CSSCI 北大核心 2016年第1期109-112,共4页
文章通过话题聚类及情感强度分析中文微博舆情,实现对微博热点问题的预测,有利于公众舆情引导。首先充分考虑微博短文本的特点,在特征值提取基础上克服了微博短文本易发生"文本漂移"的缺点,并根据微博高频词对微博进行排序实... 文章通过话题聚类及情感强度分析中文微博舆情,实现对微博热点问题的预测,有利于公众舆情引导。首先充分考虑微博短文本的特点,在特征值提取基础上克服了微博短文本易发生"文本漂移"的缺点,并根据微博高频词对微博进行排序实现微博的快速聚类,接着从主观和客观两方面对热点话题的情感强度进行了分析,基于灰色模型跟踪并预测公众情感变化倾向。实验结果表明,本文提出的基于话题聚类及情感强度的中文微博舆情分析方法具有一定的可行性。 展开更多
关键词 微博 话题聚类 网络舆情
原文传递
基于话题检测与聚类的内部舆情监测系统 被引量:8
5
作者 李忠俊 《计算机科学》 CSCD 北大核心 2012年第12期237-240,共4页
针对当前外部舆情系统中响应速度慢、准确度不高等问题,提出基于话题检测与分类的内部舆情监测系统,给出了该系统的组织模型、数据结构与运行流程;采用内外结合的频谱话题检测法来发现当前关注的热点,应用话题聚类预测模型对当前热点话... 针对当前外部舆情系统中响应速度慢、准确度不高等问题,提出基于话题检测与分类的内部舆情监测系统,给出了该系统的组织模型、数据结构与运行流程;采用内外结合的频谱话题检测法来发现当前关注的热点,应用话题聚类预测模型对当前热点话题的可能发展趋势进行预评估,并采取相应措施。实验证明,该系统具有较好的舆情预警能力和较快的响应处理速度。 展开更多
关键词 舆情 内部监控系统 话题检测 话题聚类 预测
下载PDF
基于混合聚类的微博热点话题发现方法 被引量:4
6
作者 张亚男 冯建文 《杭州电子科技大学学报(自然科学版)》 2018年第1期59-64,80,共7页
针对划分聚类算法对初始中心较为敏感的缺陷,提出了一种新的热点话题检测方法。首先,为了降低语义表达形式带来的误差,采用结合语义相似度的TF-IDF函数计算特征权重;然后,用AGNES算法进行聚类,得到初始聚类中心,再用K-means算法聚类出... 针对划分聚类算法对初始中心较为敏感的缺陷,提出了一种新的热点话题检测方法。首先,为了降低语义表达形式带来的误差,采用结合语义相似度的TF-IDF函数计算特征权重;然后,用AGNES算法进行聚类,得到初始聚类中心,再用K-means算法聚类出最终结果;最后,分析微博的转发数和评论数对热度的影响,计算话题热度并对结果进行排序。通过实验验证了新方法的有效性。 展开更多
关键词 算法 向量空间模型 话题聚类 热点话题
下载PDF
一种基于话题聚类及情感强度的微博舆情分析模型 被引量:13
7
作者 王秀芳 盛姝 路燕 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第6期37-47,共11页
【目的】构建一种微博舆情热点的监控和预测模型,从话题聚类及情感强度的角度出发解决短文本漂移、情感极性量化等问题。【方法】提出一种基于话题聚类及情感强度的微博舆情分析模型,实现微博话题快速聚类及情感强度量化计算,通过时序... 【目的】构建一种微博舆情热点的监控和预测模型,从话题聚类及情感强度的角度出发解决短文本漂移、情感极性量化等问题。【方法】提出一种基于话题聚类及情感强度的微博舆情分析模型,实现微博话题快速聚类及情感强度量化计算,通过时序回归分析追踪预测热点话题的情感变化。【结果】实验结果表明,本文模型预测准确率达88.97%,对比i Lab-Edinburgh模型提高约7%,证明了模型的可行性。【局限】未考虑突发事件下,模型对于事件的预警预测效果。【结论】本文模型能够有效提高公众情感倾向的预测准确性,为微博舆情分析方法提供新的途径。 展开更多
关键词 舆情分析 情感分析 话题聚类 情感强度分析
原文传递
基于改进K-均值的微博热点话题发现方法
8
作者 陈阳键 温秋华 《太赫兹科学与电子信息学报》 2023年第3期378-383,391,共7页
微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择... 微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。 展开更多
关键词 热点话题发现 向量空间模型 话题聚类 数据降维 微博
下载PDF
互联网新闻话题特征选择与构建 被引量:8
9
作者 赵旭剑 邓思远 +4 位作者 李波 张晖 杨春明 喻琼 王耀彬 《软件》 2015年第7期17-20,共4页
新闻话题的特征表示是建立话题模型以及进行话题聚类(融合)的基础,传统的特征构建一般采用关键字构成的向量表示模型,未对特征的选取、分类以及质量等方面进行完整的研究,因此本文拟针对互联网新闻文档进行特征提取、特征构建以及话题... 新闻话题的特征表示是建立话题模型以及进行话题聚类(融合)的基础,传统的特征构建一般采用关键字构成的向量表示模型,未对特征的选取、分类以及质量等方面进行完整的研究,因此本文拟针对互联网新闻文档进行特征提取、特征构建以及话题聚类质量分析等方面的系统研究,阐明话题特征的选择与构建对文本话题研究的影响,为后续的话题检测与追踪等应用提供更科学的特征理论模型。实验结果表明经过话题特征优选后的聚类效果有助于提高话题模型的准确性,避免噪声特征带来的话题歧义。 展开更多
关键词 话题特征 话题模型 话题聚类 特征选择
下载PDF
网络新闻话题演化模式挖掘 被引量:3
10
作者 赵旭剑 张立 +4 位作者 李波 张晖 杨春明 喻琼 王耀彬 《软件》 2015年第6期1-6,共6页
针对特定主题的新闻话题演化模式挖掘对于话题动态演化研究具有重要的研究意义和应用价值,能帮助人们清晰地梳理话题事件的来龙去脉,直观地展现话题演化轨迹的逻辑结构。针对该需求,本文提出一种面向特定话题的网络新闻话题演化模式挖... 针对特定主题的新闻话题演化模式挖掘对于话题动态演化研究具有重要的研究意义和应用价值,能帮助人们清晰地梳理话题事件的来龙去脉,直观地展现话题演化轨迹的逻辑结构。针对该需求,本文提出一种面向特定话题的网络新闻话题演化模式挖掘方法,拟从挖掘话题演化逻辑的角度出发,针对特定话题(矿难事件)进行话题演化一般规律的深入分析,对话题演变过程进行阶段化表示,建立话题演化模式。实验结果表明,本文构建的特定话题演化模式具有较强的语义表达能力,符合话题逻辑。 展开更多
关键词 话题演化 演化模式挖掘 话题聚类 TEXT RANK
下载PDF
一种分层机制的网络新闻话题融合方法
11
作者 赵旭剑 涂勇 +3 位作者 李波 张晖 杨春明 王耀彬 《电脑知识与技术》 2015年第5X期212-214,共3页
传统的新闻话题融合方法往往将话题表示为一个统一的一层模型进行聚类融合,对于具有多层结构的网络新闻存在模型缺陷,容易忽略子话题的细节特征,影响新闻话题的融合结果。针对该问题,本文提出一种基于分层机制的网络新闻话题融合方法,... 传统的新闻话题融合方法往往将话题表示为一个统一的一层模型进行聚类融合,对于具有多层结构的网络新闻存在模型缺陷,容易忽略子话题的细节特征,影响新闻话题的融合结果。针对该问题,本文提出一种基于分层机制的网络新闻话题融合方法,研究话题的多层表示模型,实现对网络新闻话题的自动聚类。实验表明,本文方法较传统方法具有更高的准确率,能有效识别网络新闻在子话题上的特征差异。 展开更多
关键词 多层表示模型 分层机制 新闻话题 话题融合 话题聚类
下载PDF
基于内容分析的中文BBS话题检测系统的设计与实现 被引量:5
12
作者 赵艳红 聂哲 《计算机应用与软件》 CSCD 2011年第6期242-246,共5页
通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS... 通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS话题进行聚类,基于功率谱的热点话题分析以及基于时间序列的话题预测。最后,通过采用J2EE开发包及Eclipse集成开发环境,结合Hibernate、GWT等技术实现了中文BBS话题检测系统,并在多个BBS论坛上进行了测试,取得了良好的效果。 展开更多
关键词 BBS话题检测 网络爬虫 话题聚类 热点分析
下载PDF
基于自动机的微博在线突发话题检测算法 被引量:1
13
作者 谢乾龙 徐蔚然 《软件》 2012年第12期109-113,共5页
提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征... 提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征,使得聚类效果更加准确,得到的突发话题可读性更强。最后通过实验方法验证了算法的可行性。 展开更多
关键词 文本检索 突发话题检测 话题聚类
下载PDF
中文微博热点事件情感分布的原因分析 被引量:3
14
作者 李泽魁 李雪婷 赵妍妍 《中文信息学报》 CSCD 北大核心 2018年第1期131-138,共8页
微博作为新兴的社交媒体平台,越来越多的网民选择在微博上获取与分享自己感兴趣的信息。在微博日均千万级的大数据面前,分析网民对某一事件的观点与态度是一件非常有意义的工作。调研中发现,大众对单个事件的不同话题存在不同的情感分... 微博作为新兴的社交媒体平台,越来越多的网民选择在微博上获取与分享自己感兴趣的信息。在微博日均千万级的大数据面前,分析网民对某一事件的观点与态度是一件非常有意义的工作。调研中发现,大众对单个事件的不同话题存在不同的情感分布。针对这一现象,该文提出了使用无监督学习的层次聚类排序方法和半监督学习的微博话题纠正算法两种方法,进行事件话题及其相关微博的挖掘。最后利用情感分析的相关技术,达到对相关微博进行情感分布统计及其原因分析的目的。通过在人工构建的数据集上测试,结果表明该方法能够准确分析事件情感分布的原因。 展开更多
关键词 情感原因分析 话题聚类 话题纠正 中文微博
下载PDF
面向海量新闻数据的舆情分析技术研究
15
作者 万倩 朱里越 《广播电视信息》 2021年第10期93-97,共5页
本文针对广电行业对互联网新闻舆情的分析需求,构建了一套面向海量新闻数据的广电舆情分析系统,并设计了适用于海量新闻数据聚类的算法,满足了广电行业对互联网新闻数据的智能检索、话题聚类及新闻分析等舆情分析需求,帮助用户实时分析... 本文针对广电行业对互联网新闻舆情的分析需求,构建了一套面向海量新闻数据的广电舆情分析系统,并设计了适用于海量新闻数据聚类的算法,满足了广电行业对互联网新闻数据的智能检索、话题聚类及新闻分析等舆情分析需求,帮助用户实时分析和监控互联网新闻热点,掌控新闻热度和传播走势,及时发现舆情风险并制定相应策略。 展开更多
关键词 智能检索 话题聚类 舆情 广电行业 新闻数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部