期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
15
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于文本融合特征的突发事件子话题聚类研究
1
作者
芦子涵
郑中团
《智能计算机与应用》
2023年第10期45-51,55,共8页
突发事件具有突发性、公共性、传播范围广等特点,研究同一突发事件中更细粒度的子话题聚类,对舆情管控部门实现精准化管控具有重要意义。针对以往话题聚类方法忽略了同一事件下更细粒度的子话题聚类,且为了更有效地表达微博文本的语义信...
突发事件具有突发性、公共性、传播范围广等特点,研究同一突发事件中更细粒度的子话题聚类,对舆情管控部门实现精准化管控具有重要意义。针对以往话题聚类方法忽略了同一事件下更细粒度的子话题聚类,且为了更有效地表达微博文本的语义信息,提出一种基于LDA文档-主题分布与Doc2Vec句向量融合的文本特征表示方法与文本相似度计算方法,应用Single-Pass增量聚类算法实现同一突发事件下子话题聚类,并根据F1值与单一文本特征子话题聚类实验结果进行对比。结果表明,本文方法子话题聚类效果更佳,F1值为72.4%,表明该方法能够有效地表达文本特征,进而提高子话题聚类的准确度。
展开更多
关键词
突发事件
子
话题聚类
文本特征
LDA主题模型
Doc2Vec模型
下载PDF
职称材料
网络舆情热点话题聚类方法研究
被引量:
25
2
作者
张寿华
刘振鹏
《小型微型计算机系统》
CSCD
北大核心
2013年第3期471-474,共4页
主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点...
主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点,改善舆情信息采集策略;网络舆情的相关页面标题文字主题鲜明,据此提出自动挖掘热点关键词并根据关键词进行话题聚类的方法;根据新闻、论坛和博客的不同特点分别设计网络舆情热点分析模型.在此基础上,设计并实现了一个网络舆情监测系统.系统实际运行表明,该方案可以及时发掘热点话题并对突发事件实时追踪监测.
展开更多
关键词
网络舆情
话题聚类
热点
话题
追踪监测
下载PDF
职称材料
融合内容与时间特征的中文新闻子话题聚类
被引量:
5
3
作者
仲兆满
李存华
+1 位作者
戴红伟
刘宗田
《计算机科学与探索》
CSCD
2013年第4期368-376,共9页
子话题是对话题的再次划分,是比话题粒度更细的新兴研究方向,子话题的聚类是话题内部演化关系分析的基础。提出了融合内容特征和时间特征的中文新闻子话题聚类方法,重点分析了子话题内容特征的表现规律,研究了子话题特征词的权重计算和...
子话题是对话题的再次划分,是比话题粒度更细的新兴研究方向,子话题的聚类是话题内部演化关系分析的基础。提出了融合内容特征和时间特征的中文新闻子话题聚类方法,重点分析了子话题内容特征的表现规律,研究了子话题特征词的权重计算和降维方法。选取5个话题的18个子话题进行了实验,结果表明,所提方法的性能与已有的子话题聚类方法相比有显著提高。
展开更多
关键词
话题
演化
子
话题聚类
内容特征
时间特征
下载PDF
职称材料
基于话题聚类及情感强度的中文微博舆情分析
被引量:
27
4
作者
吴青林
周天宏
《情报理论与实践》
CSSCI
北大核心
2016年第1期109-112,共4页
文章通过话题聚类及情感强度分析中文微博舆情,实现对微博热点问题的预测,有利于公众舆情引导。首先充分考虑微博短文本的特点,在特征值提取基础上克服了微博短文本易发生"文本漂移"的缺点,并根据微博高频词对微博进行排序实...
文章通过话题聚类及情感强度分析中文微博舆情,实现对微博热点问题的预测,有利于公众舆情引导。首先充分考虑微博短文本的特点,在特征值提取基础上克服了微博短文本易发生"文本漂移"的缺点,并根据微博高频词对微博进行排序实现微博的快速聚类,接着从主观和客观两方面对热点话题的情感强度进行了分析,基于灰色模型跟踪并预测公众情感变化倾向。实验结果表明,本文提出的基于话题聚类及情感强度的中文微博舆情分析方法具有一定的可行性。
展开更多
关键词
微博
话题聚类
网络舆情
原文传递
基于话题检测与聚类的内部舆情监测系统
被引量:
8
5
作者
李忠俊
《计算机科学》
CSCD
北大核心
2012年第12期237-240,共4页
针对当前外部舆情系统中响应速度慢、准确度不高等问题,提出基于话题检测与分类的内部舆情监测系统,给出了该系统的组织模型、数据结构与运行流程;采用内外结合的频谱话题检测法来发现当前关注的热点,应用话题聚类预测模型对当前热点话...
针对当前外部舆情系统中响应速度慢、准确度不高等问题,提出基于话题检测与分类的内部舆情监测系统,给出了该系统的组织模型、数据结构与运行流程;采用内外结合的频谱话题检测法来发现当前关注的热点,应用话题聚类预测模型对当前热点话题的可能发展趋势进行预评估,并采取相应措施。实验证明,该系统具有较好的舆情预警能力和较快的响应处理速度。
展开更多
关键词
舆情
内部监控系统
话题
检测
话题聚类
预测
下载PDF
职称材料
基于混合聚类的微博热点话题发现方法
被引量:
4
6
作者
张亚男
冯建文
《杭州电子科技大学学报(自然科学版)》
2018年第1期59-64,80,共7页
针对划分聚类算法对初始中心较为敏感的缺陷,提出了一种新的热点话题检测方法。首先,为了降低语义表达形式带来的误差,采用结合语义相似度的TF-IDF函数计算特征权重;然后,用AGNES算法进行聚类,得到初始聚类中心,再用K-means算法聚类出...
针对划分聚类算法对初始中心较为敏感的缺陷,提出了一种新的热点话题检测方法。首先,为了降低语义表达形式带来的误差,采用结合语义相似度的TF-IDF函数计算特征权重;然后,用AGNES算法进行聚类,得到初始聚类中心,再用K-means算法聚类出最终结果;最后,分析微博的转发数和评论数对热度的影响,计算话题热度并对结果进行排序。通过实验验证了新方法的有效性。
展开更多
关键词
聚
类
算法
向量空间模型
话题聚类
热点
话题
下载PDF
职称材料
一种基于话题聚类及情感强度的微博舆情分析模型
被引量:
13
7
作者
王秀芳
盛姝
路燕
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018年第6期37-47,共11页
【目的】构建一种微博舆情热点的监控和预测模型,从话题聚类及情感强度的角度出发解决短文本漂移、情感极性量化等问题。【方法】提出一种基于话题聚类及情感强度的微博舆情分析模型,实现微博话题快速聚类及情感强度量化计算,通过时序...
【目的】构建一种微博舆情热点的监控和预测模型,从话题聚类及情感强度的角度出发解决短文本漂移、情感极性量化等问题。【方法】提出一种基于话题聚类及情感强度的微博舆情分析模型,实现微博话题快速聚类及情感强度量化计算,通过时序回归分析追踪预测热点话题的情感变化。【结果】实验结果表明,本文模型预测准确率达88.97%,对比i Lab-Edinburgh模型提高约7%,证明了模型的可行性。【局限】未考虑突发事件下,模型对于事件的预警预测效果。【结论】本文模型能够有效提高公众情感倾向的预测准确性,为微博舆情分析方法提供新的途径。
展开更多
关键词
舆情分析
情感分析
话题聚类
情感强度分析
原文传递
基于改进K-均值的微博热点话题发现方法
8
作者
陈阳键
温秋华
《太赫兹科学与电子信息学报》
2023年第3期378-383,391,共7页
微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择...
微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。
展开更多
关键词
热点
话题
发现
向量空间模型
话题聚类
数据降维
微博
下载PDF
职称材料
互联网新闻话题特征选择与构建
被引量:
8
9
作者
赵旭剑
邓思远
+4 位作者
李波
张晖
杨春明
喻琼
王耀彬
《软件》
2015年第7期17-20,共4页
新闻话题的特征表示是建立话题模型以及进行话题聚类(融合)的基础,传统的特征构建一般采用关键字构成的向量表示模型,未对特征的选取、分类以及质量等方面进行完整的研究,因此本文拟针对互联网新闻文档进行特征提取、特征构建以及话题...
新闻话题的特征表示是建立话题模型以及进行话题聚类(融合)的基础,传统的特征构建一般采用关键字构成的向量表示模型,未对特征的选取、分类以及质量等方面进行完整的研究,因此本文拟针对互联网新闻文档进行特征提取、特征构建以及话题聚类质量分析等方面的系统研究,阐明话题特征的选择与构建对文本话题研究的影响,为后续的话题检测与追踪等应用提供更科学的特征理论模型。实验结果表明经过话题特征优选后的聚类效果有助于提高话题模型的准确性,避免噪声特征带来的话题歧义。
展开更多
关键词
话题
特征
话题
模型
话题聚类
特征选择
下载PDF
职称材料
网络新闻话题演化模式挖掘
被引量:
3
10
作者
赵旭剑
张立
+4 位作者
李波
张晖
杨春明
喻琼
王耀彬
《软件》
2015年第6期1-6,共6页
针对特定主题的新闻话题演化模式挖掘对于话题动态演化研究具有重要的研究意义和应用价值,能帮助人们清晰地梳理话题事件的来龙去脉,直观地展现话题演化轨迹的逻辑结构。针对该需求,本文提出一种面向特定话题的网络新闻话题演化模式挖...
针对特定主题的新闻话题演化模式挖掘对于话题动态演化研究具有重要的研究意义和应用价值,能帮助人们清晰地梳理话题事件的来龙去脉,直观地展现话题演化轨迹的逻辑结构。针对该需求,本文提出一种面向特定话题的网络新闻话题演化模式挖掘方法,拟从挖掘话题演化逻辑的角度出发,针对特定话题(矿难事件)进行话题演化一般规律的深入分析,对话题演变过程进行阶段化表示,建立话题演化模式。实验结果表明,本文构建的特定话题演化模式具有较强的语义表达能力,符合话题逻辑。
展开更多
关键词
话题
演化
演化模式挖掘
话题聚类
TEXT
RANK
下载PDF
职称材料
一种分层机制的网络新闻话题融合方法
11
作者
赵旭剑
涂勇
+3 位作者
李波
张晖
杨春明
王耀彬
《电脑知识与技术》
2015年第5X期212-214,共3页
传统的新闻话题融合方法往往将话题表示为一个统一的一层模型进行聚类融合,对于具有多层结构的网络新闻存在模型缺陷,容易忽略子话题的细节特征,影响新闻话题的融合结果。针对该问题,本文提出一种基于分层机制的网络新闻话题融合方法,...
传统的新闻话题融合方法往往将话题表示为一个统一的一层模型进行聚类融合,对于具有多层结构的网络新闻存在模型缺陷,容易忽略子话题的细节特征,影响新闻话题的融合结果。针对该问题,本文提出一种基于分层机制的网络新闻话题融合方法,研究话题的多层表示模型,实现对网络新闻话题的自动聚类。实验表明,本文方法较传统方法具有更高的准确率,能有效识别网络新闻在子话题上的特征差异。
展开更多
关键词
多层表示模型
分层机制
新闻
话题
话题
融合
话题聚类
下载PDF
职称材料
基于内容分析的中文BBS话题检测系统的设计与实现
被引量:
5
12
作者
赵艳红
聂哲
《计算机应用与软件》
CSCD
2011年第6期242-246,共5页
通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS...
通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS话题进行聚类,基于功率谱的热点话题分析以及基于时间序列的话题预测。最后,通过采用J2EE开发包及Eclipse集成开发环境,结合Hibernate、GWT等技术实现了中文BBS话题检测系统,并在多个BBS论坛上进行了测试,取得了良好的效果。
展开更多
关键词
BBS
话题
检测
网络爬虫
话题聚类
热点分析
下载PDF
职称材料
基于自动机的微博在线突发话题检测算法
被引量:
1
13
作者
谢乾龙
徐蔚然
《软件》
2012年第12期109-113,共5页
提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征...
提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征,使得聚类效果更加准确,得到的突发话题可读性更强。最后通过实验方法验证了算法的可行性。
展开更多
关键词
文本检索
突发
话题
检测
话题聚类
下载PDF
职称材料
中文微博热点事件情感分布的原因分析
被引量:
3
14
作者
李泽魁
李雪婷
赵妍妍
《中文信息学报》
CSCD
北大核心
2018年第1期131-138,共8页
微博作为新兴的社交媒体平台,越来越多的网民选择在微博上获取与分享自己感兴趣的信息。在微博日均千万级的大数据面前,分析网民对某一事件的观点与态度是一件非常有意义的工作。调研中发现,大众对单个事件的不同话题存在不同的情感分...
微博作为新兴的社交媒体平台,越来越多的网民选择在微博上获取与分享自己感兴趣的信息。在微博日均千万级的大数据面前,分析网民对某一事件的观点与态度是一件非常有意义的工作。调研中发现,大众对单个事件的不同话题存在不同的情感分布。针对这一现象,该文提出了使用无监督学习的层次聚类排序方法和半监督学习的微博话题纠正算法两种方法,进行事件话题及其相关微博的挖掘。最后利用情感分析的相关技术,达到对相关微博进行情感分布统计及其原因分析的目的。通过在人工构建的数据集上测试,结果表明该方法能够准确分析事件情感分布的原因。
展开更多
关键词
情感原因分析
话题聚类
话题
纠正
中文微博
下载PDF
职称材料
面向海量新闻数据的舆情分析技术研究
15
作者
万倩
朱里越
《广播电视信息》
2021年第10期93-97,共5页
本文针对广电行业对互联网新闻舆情的分析需求,构建了一套面向海量新闻数据的广电舆情分析系统,并设计了适用于海量新闻数据聚类的算法,满足了广电行业对互联网新闻数据的智能检索、话题聚类及新闻分析等舆情分析需求,帮助用户实时分析...
本文针对广电行业对互联网新闻舆情的分析需求,构建了一套面向海量新闻数据的广电舆情分析系统,并设计了适用于海量新闻数据聚类的算法,满足了广电行业对互联网新闻数据的智能检索、话题聚类及新闻分析等舆情分析需求,帮助用户实时分析和监控互联网新闻热点,掌控新闻热度和传播走势,及时发现舆情风险并制定相应策略。
展开更多
关键词
智能检索
话题聚类
舆情
广电行业
新闻数据
下载PDF
职称材料
题名
基于文本融合特征的突发事件子话题聚类研究
1
作者
芦子涵
郑中团
机构
上海工程技术大学数理与统计学院
出处
《智能计算机与应用》
2023年第10期45-51,55,共8页
基金
全国统计科学研究项目(2020LY080)。
文摘
突发事件具有突发性、公共性、传播范围广等特点,研究同一突发事件中更细粒度的子话题聚类,对舆情管控部门实现精准化管控具有重要意义。针对以往话题聚类方法忽略了同一事件下更细粒度的子话题聚类,且为了更有效地表达微博文本的语义信息,提出一种基于LDA文档-主题分布与Doc2Vec句向量融合的文本特征表示方法与文本相似度计算方法,应用Single-Pass增量聚类算法实现同一突发事件下子话题聚类,并根据F1值与单一文本特征子话题聚类实验结果进行对比。结果表明,本文方法子话题聚类效果更佳,F1值为72.4%,表明该方法能够有效地表达文本特征,进而提高子话题聚类的准确度。
关键词
突发事件
子
话题聚类
文本特征
LDA主题模型
Doc2Vec模型
Keywords
emergency
sub-topic clustering
text features
LDA topic model
Doc2Vec model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
网络舆情热点话题聚类方法研究
被引量:
25
2
作者
张寿华
刘振鹏
机构
河北大学数学与计算机学院
河北大学网络中心
出处
《小型微型计算机系统》
CSCD
北大核心
2013年第3期471-474,共4页
基金
国家自然科学基金项目(60873203)资助
文摘
主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点,改善舆情信息采集策略;网络舆情的相关页面标题文字主题鲜明,据此提出自动挖掘热点关键词并根据关键词进行话题聚类的方法;根据新闻、论坛和博客的不同特点分别设计网络舆情热点分析模型.在此基础上,设计并实现了一个网络舆情监测系统.系统实际运行表明,该方案可以及时发掘热点话题并对突发事件实时追踪监测.
关键词
网络舆情
话题聚类
热点
话题
追踪监测
Keywords
internet public opinion
topic clustering
hot topic
tracking
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合内容与时间特征的中文新闻子话题聚类
被引量:
5
3
作者
仲兆满
李存华
戴红伟
刘宗田
机构
淮海工学院计算机工程学院
上海大学计算机工程与科学学院
出处
《计算机科学与探索》
CSCD
2013年第4期368-376,共9页
基金
国家自然科学基金No.60975033
连云港市自然科学基金No.CG1121~~
文摘
子话题是对话题的再次划分,是比话题粒度更细的新兴研究方向,子话题的聚类是话题内部演化关系分析的基础。提出了融合内容特征和时间特征的中文新闻子话题聚类方法,重点分析了子话题内容特征的表现规律,研究了子话题特征词的权重计算和降维方法。选取5个话题的18个子话题进行了实验,结果表明,所提方法的性能与已有的子话题聚类方法相比有显著提高。
关键词
话题
演化
子
话题聚类
内容特征
时间特征
Keywords
topic evolution
subtopic clustering
content features
time features
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于话题聚类及情感强度的中文微博舆情分析
被引量:
27
4
作者
吴青林
周天宏
机构
郧阳师范高等专科学校计算机科学系
武汉商学院信息工程系
出处
《情报理论与实践》
CSSCI
北大核心
2016年第1期109-112,共4页
基金
湖北省教育厅重点科研项目"基于服务质量的Web服务组合及应用"的成果
项目编号:D20145001
文摘
文章通过话题聚类及情感强度分析中文微博舆情,实现对微博热点问题的预测,有利于公众舆情引导。首先充分考虑微博短文本的特点,在特征值提取基础上克服了微博短文本易发生"文本漂移"的缺点,并根据微博高频词对微博进行排序实现微博的快速聚类,接着从主观和客观两方面对热点话题的情感强度进行了分析,基于灰色模型跟踪并预测公众情感变化倾向。实验结果表明,本文提出的基于话题聚类及情感强度的中文微博舆情分析方法具有一定的可行性。
关键词
微博
话题聚类
网络舆情
Keywords
microblog
topic clustering
online public opinion
分类号
G206 [文化科学—传播学]
原文传递
题名
基于话题检测与聚类的内部舆情监测系统
被引量:
8
5
作者
李忠俊
机构
西南财经大学经济信息工程学院
出处
《计算机科学》
CSCD
北大核心
2012年第12期237-240,共4页
基金
教育部人文社科项目(10YJCZH169)
四川省金融智能与金融工程重点实验室项目(FIFE2010-P05)
西南财经大学校管课题(2010XG068)资助
文摘
针对当前外部舆情系统中响应速度慢、准确度不高等问题,提出基于话题检测与分类的内部舆情监测系统,给出了该系统的组织模型、数据结构与运行流程;采用内外结合的频谱话题检测法来发现当前关注的热点,应用话题聚类预测模型对当前热点话题的可能发展趋势进行预评估,并采取相应措施。实验证明,该系统具有较好的舆情预警能力和较快的响应处理速度。
关键词
舆情
内部监控系统
话题
检测
话题聚类
预测
Keywords
Public opinion
Internal monitor system
Topic detection
Topic clustering
Predict
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于混合聚类的微博热点话题发现方法
被引量:
4
6
作者
张亚男
冯建文
机构
杭州电子科技大学计算机学院
出处
《杭州电子科技大学学报(自然科学版)》
2018年第1期59-64,80,共7页
文摘
针对划分聚类算法对初始中心较为敏感的缺陷,提出了一种新的热点话题检测方法。首先,为了降低语义表达形式带来的误差,采用结合语义相似度的TF-IDF函数计算特征权重;然后,用AGNES算法进行聚类,得到初始聚类中心,再用K-means算法聚类出最终结果;最后,分析微博的转发数和评论数对热度的影响,计算话题热度并对结果进行排序。通过实验验证了新方法的有效性。
关键词
聚
类
算法
向量空间模型
话题聚类
热点
话题
Keywords
clustering algorithm
vector space model
topic clustering
hot topic
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于话题聚类及情感强度的微博舆情分析模型
被引量:
13
7
作者
王秀芳
盛姝
路燕
机构
山东科技大学计算机科学与工程学院
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018年第6期37-47,共11页
基金
山东科技大学2018年研究生科技创新项目"一种基于话题聚类及情感强度的微博舆情分析模型"(项目编号:SDKDYC180222)的研究成果之一
文摘
【目的】构建一种微博舆情热点的监控和预测模型,从话题聚类及情感强度的角度出发解决短文本漂移、情感极性量化等问题。【方法】提出一种基于话题聚类及情感强度的微博舆情分析模型,实现微博话题快速聚类及情感强度量化计算,通过时序回归分析追踪预测热点话题的情感变化。【结果】实验结果表明,本文模型预测准确率达88.97%,对比i Lab-Edinburgh模型提高约7%,证明了模型的可行性。【局限】未考虑突发事件下,模型对于事件的预警预测效果。【结论】本文模型能够有效提高公众情感倾向的预测准确性,为微博舆情分析方法提供新的途径。
关键词
舆情分析
情感分析
话题聚类
情感强度分析
Keywords
Public Opinion
Analysis Sentiment
Analysis Topic Clustering
Sentiment Intensity Analysis
分类号
G353.1 [文化科学—情报学]
原文传递
题名
基于改进K-均值的微博热点话题发现方法
8
作者
陈阳键
温秋华
机构
广州开放大学(广州市广播电视大学)数字化服务中心
暨南大学信息科学技术学院
出处
《太赫兹科学与电子信息学报》
2023年第3期378-383,391,共7页
基金
广东省广州市高校第九批教育教学改革基金资助项目(2017F10)。
文摘
微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。
关键词
热点
话题
发现
向量空间模型
话题聚类
数据降维
微博
Keywords
hot topic detection
Vector Space Model
topic clustering
data dimensionality reduction
Micro-blog
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
互联网新闻话题特征选择与构建
被引量:
8
9
作者
赵旭剑
邓思远
李波
张晖
杨春明
喻琼
王耀彬
机构
西南科技大学计算机科学与技术学院
出处
《软件》
2015年第7期17-20,共4页
基金
国家自然科学基金(61202044)
四川省教育厅科研基金(12ZB326)
+1 种基金
绵阳市网络融合工程实验室开放课题(12ZXWK04)
西南科技大学博士研究基金(12zx7116)
文摘
新闻话题的特征表示是建立话题模型以及进行话题聚类(融合)的基础,传统的特征构建一般采用关键字构成的向量表示模型,未对特征的选取、分类以及质量等方面进行完整的研究,因此本文拟针对互联网新闻文档进行特征提取、特征构建以及话题聚类质量分析等方面的系统研究,阐明话题特征的选择与构建对文本话题研究的影响,为后续的话题检测与追踪等应用提供更科学的特征理论模型。实验结果表明经过话题特征优选后的聚类效果有助于提高话题模型的准确性,避免噪声特征带来的话题歧义。
关键词
话题
特征
话题
模型
话题聚类
特征选择
Keywords
Topic feature
Topic model
Topic cluster
Feature selection
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
网络新闻话题演化模式挖掘
被引量:
3
10
作者
赵旭剑
张立
李波
张晖
杨春明
喻琼
王耀彬
机构
西南科技大学计算机科学与技术学院
出处
《软件》
2015年第6期1-6,共6页
基金
国家自然科学基金(61202044)
四川省教育厅科研基金(12ZB326)
+1 种基金
绵阳市网络融合工程实验室开放课题(12ZXWK04)
西南科技大学博士研究基金(12zx7116)
文摘
针对特定主题的新闻话题演化模式挖掘对于话题动态演化研究具有重要的研究意义和应用价值,能帮助人们清晰地梳理话题事件的来龙去脉,直观地展现话题演化轨迹的逻辑结构。针对该需求,本文提出一种面向特定话题的网络新闻话题演化模式挖掘方法,拟从挖掘话题演化逻辑的角度出发,针对特定话题(矿难事件)进行话题演化一般规律的深入分析,对话题演变过程进行阶段化表示,建立话题演化模式。实验结果表明,本文构建的特定话题演化模式具有较强的语义表达能力,符合话题逻辑。
关键词
话题
演化
演化模式挖掘
话题聚类
TEXT
RANK
Keywords
Topic evolution
Evolution patterns mining
Topic cluster
Text rank
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种分层机制的网络新闻话题融合方法
11
作者
赵旭剑
涂勇
李波
张晖
杨春明
王耀彬
机构
西南科技大学计算机科学与技术学院
出处
《电脑知识与技术》
2015年第5X期212-214,共3页
基金
国家自然科学基金(61202044)
四川省教育厅科研基金(12ZB326)
+1 种基金
绵阳市网络融合工程实验室开放课题(12ZXWK04)
西南科技大学博士研究基金(12zx7116)
文摘
传统的新闻话题融合方法往往将话题表示为一个统一的一层模型进行聚类融合,对于具有多层结构的网络新闻存在模型缺陷,容易忽略子话题的细节特征,影响新闻话题的融合结果。针对该问题,本文提出一种基于分层机制的网络新闻话题融合方法,研究话题的多层表示模型,实现对网络新闻话题的自动聚类。实验表明,本文方法较传统方法具有更高的准确率,能有效识别网络新闻在子话题上的特征差异。
关键词
多层表示模型
分层机制
新闻
话题
话题
融合
话题聚类
Keywords
multi-level representation model
hierarchical method
news topic
topic fusion
topic cluster
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于内容分析的中文BBS话题检测系统的设计与实现
被引量:
5
12
作者
赵艳红
聂哲
机构
深圳职业技术学院电子与信息工程学院
出处
《计算机应用与软件》
CSCD
2011年第6期242-246,共5页
基金
深圳市科技计划项目资助课题(07KJce140)
文摘
通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS话题进行聚类,基于功率谱的热点话题分析以及基于时间序列的话题预测。最后,通过采用J2EE开发包及Eclipse集成开发环境,结合Hibernate、GWT等技术实现了中文BBS话题检测系统,并在多个BBS论坛上进行了测试,取得了良好的效果。
关键词
BBS
话题
检测
网络爬虫
话题聚类
热点分析
Keywords
BBS Topic detection Web crawler Topic clustering Hot spot analysis
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于自动机的微博在线突发话题检测算法
被引量:
1
13
作者
谢乾龙
徐蔚然
机构
北京邮电大学信息与通信工程学院
北京邮电大学模式识别实验室
出处
《软件》
2012年第12期109-113,共5页
文摘
提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征,使得聚类效果更加准确,得到的突发话题可读性更强。最后通过实验方法验证了算法的可行性。
关键词
文本检索
突发
话题
检测
话题聚类
Keywords
Text Retrieval
Burst Event Detection
Topic Clustering
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文微博热点事件情感分布的原因分析
被引量:
3
14
作者
李泽魁
李雪婷
赵妍妍
机构
哈尔滨工业大学计算机科学与技术学院信息检索研究中心
哈尔滨工业大学图书馆信息咨询部
哈尔滨工业大学机电学院媒体系
出处
《中文信息学报》
CSCD
北大核心
2018年第1期131-138,共8页
基金
中国博士后科学基金(2012M520740
2013T60373
2012M520742)
文摘
微博作为新兴的社交媒体平台,越来越多的网民选择在微博上获取与分享自己感兴趣的信息。在微博日均千万级的大数据面前,分析网民对某一事件的观点与态度是一件非常有意义的工作。调研中发现,大众对单个事件的不同话题存在不同的情感分布。针对这一现象,该文提出了使用无监督学习的层次聚类排序方法和半监督学习的微博话题纠正算法两种方法,进行事件话题及其相关微博的挖掘。最后利用情感分析的相关技术,达到对相关微博进行情感分布统计及其原因分析的目的。通过在人工构建的数据集上测试,结果表明该方法能够准确分析事件情感分布的原因。
关键词
情感原因分析
话题聚类
话题
纠正
中文微博
Keywords
emotion causation analysis
topic cluster
topic rectification
Chinese microblog
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向海量新闻数据的舆情分析技术研究
15
作者
万倩
朱里越
机构
国家广播电视总局广播电视科学研究院
出处
《广播电视信息》
2021年第10期93-97,共5页
基金
国家广播电视总局广播电视科学研究院基本科研项目“基于人工智能的舆情分析及舆论引导”资金支持(项目号:JBKY2019032)。
文摘
本文针对广电行业对互联网新闻舆情的分析需求,构建了一套面向海量新闻数据的广电舆情分析系统,并设计了适用于海量新闻数据聚类的算法,满足了广电行业对互联网新闻数据的智能检索、话题聚类及新闻分析等舆情分析需求,帮助用户实时分析和监控互联网新闻热点,掌控新闻热度和传播走势,及时发现舆情风险并制定相应策略。
关键词
智能检索
话题聚类
舆情
广电行业
新闻数据
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
G220.7 [文化科学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于文本融合特征的突发事件子话题聚类研究
芦子涵
郑中团
《智能计算机与应用》
2023
0
下载PDF
职称材料
2
网络舆情热点话题聚类方法研究
张寿华
刘振鹏
《小型微型计算机系统》
CSCD
北大核心
2013
25
下载PDF
职称材料
3
融合内容与时间特征的中文新闻子话题聚类
仲兆满
李存华
戴红伟
刘宗田
《计算机科学与探索》
CSCD
2013
5
下载PDF
职称材料
4
基于话题聚类及情感强度的中文微博舆情分析
吴青林
周天宏
《情报理论与实践》
CSSCI
北大核心
2016
27
原文传递
5
基于话题检测与聚类的内部舆情监测系统
李忠俊
《计算机科学》
CSCD
北大核心
2012
8
下载PDF
职称材料
6
基于混合聚类的微博热点话题发现方法
张亚男
冯建文
《杭州电子科技大学学报(自然科学版)》
2018
4
下载PDF
职称材料
7
一种基于话题聚类及情感强度的微博舆情分析模型
王秀芳
盛姝
路燕
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018
13
原文传递
8
基于改进K-均值的微博热点话题发现方法
陈阳键
温秋华
《太赫兹科学与电子信息学报》
2023
0
下载PDF
职称材料
9
互联网新闻话题特征选择与构建
赵旭剑
邓思远
李波
张晖
杨春明
喻琼
王耀彬
《软件》
2015
8
下载PDF
职称材料
10
网络新闻话题演化模式挖掘
赵旭剑
张立
李波
张晖
杨春明
喻琼
王耀彬
《软件》
2015
3
下载PDF
职称材料
11
一种分层机制的网络新闻话题融合方法
赵旭剑
涂勇
李波
张晖
杨春明
王耀彬
《电脑知识与技术》
2015
0
下载PDF
职称材料
12
基于内容分析的中文BBS话题检测系统的设计与实现
赵艳红
聂哲
《计算机应用与软件》
CSCD
2011
5
下载PDF
职称材料
13
基于自动机的微博在线突发话题检测算法
谢乾龙
徐蔚然
《软件》
2012
1
下载PDF
职称材料
14
中文微博热点事件情感分布的原因分析
李泽魁
李雪婷
赵妍妍
《中文信息学报》
CSCD
北大核心
2018
3
下载PDF
职称材料
15
面向海量新闻数据的舆情分析技术研究
万倩
朱里越
《广播电视信息》
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部