期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于微博的COVID-19热点话题分析被引量：7

Analysis of COVID-19 Hot Topics Based on Weibo

原文传递

导出

摘要新型冠状病毒肺炎(corona virus disease 2019,COVID-19)的快速暴发引发了广泛的社会关注,给网络舆情分析带来了极大的挑战。针对这个问题,本文使用网络爬虫技术对官方媒体发布的关于COVID-19的评论信息进行数据收集,对收集到的评论信息按时间顺序进行排列,首先使用TF-IDF对文本的关键特征词进行提取,其次利用OLDA(online latent Dirichlet allocation)模型依照时间顺序进行主题词演化分析,构建评论集词向量模型,最后使用K-means对主题进行聚类,并对聚类结果通过词性标注进行分析。实验表明,本文的方法可以获得随时间变化的评论信息,能够检测到需要关注的信息。 The rapid outbreak of COVID-19 has aroused a wide range of social concerns, which has brought great challenges to the analysis of online public opinions. To solve this problem, this paper uses the web crawler technology to collect the data of the information comments on COVID-19 published by the official media, and arranges the collected comments in chronological order.First, TF-IDF is used to extract the key feature words of the text, then OLDA model is used to analyze the evolution of the subject words in chronological order, and then a vector model of comment set words is constructed.Then K-means is used to cluster the topics, and the clustering results are analyzed by part of speech tagging. Experiments show that this method can get the information in the comments changing with time, and can detect the information that needs to be concerned.

作者黄勃陈欢方志军王明胜刘文竹 HUANG Bo;CHEN Huan;FANG Zhijun;WANG Mingsheng;LIU Wenzhu(School of Electronic and Electrical Engineering,Shanghai University of Engineering Science,Shanghai 201620,China;In dustrial and Commercial Bank of China Hefei Branch,Hefei 230031,Anhui,China)

机构地区上海工程技术大学电子电气工程学院中国工商银行股份有限公司合肥分行

出处《武汉大学学报（理学版）》 CAS CSCD 北大核心 2020年第5期425-432,共8页 Journal of Wuhan University:Natural Science Edition

基金国家自然科学基金青年基金(61603242,61802251) 江西省经济犯罪侦查与防控技术协同创新中心开放基金资助课题(JXJZXTCX-030)。

关键词新型冠状病毒肺炎舆情分析 OLDA TF-IDF K-MEANS word2vec COVID-19(corona virus disease 2019) public opinion analysis OLDA(online latent Dirichlet allocation) TF-IDF K-means word2vec

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献18

1林丽丽,马秀峰.基于LDA模型的国内图书情报学研究主题发现及演化分析[J].情报科学,2019,37(12):87-92. 被引量：26
2周义棋,田向亮,钟茂华.基于微博网络爬虫的巴黎圣母院大火舆情分析[J].武汉理工大学学报（信息与管理工程版）,2019,41(5):461-466. 被引量：14
3陈兴蜀,常天祐,王海舟,赵志龙,张杰.基于微博数据的“新冠肺炎疫情”舆情演化时空分析[J].四川大学学报（自然科学版）,2020,57(2):409-416. 被引量：88
4钟熙,孙祥娥.基于Kmeans++聚类的朴素贝叶斯集成方法研究[J].计算机科学,2019,46(B06):439-441. 被引量：26
5刘家益,李鲡瑶,张智雄,邹益民.关键词和被引次数对科技论文自动摘要效果影响研究[J].情报学报,2017,36(11):1165-1174. 被引量：6
6张佩瑶,刘东苏.基于词向量的话题焦点识别方法[J].情报科学,2019,37(7):61-64. 被引量：5
7张克君,史泰猛,李伟男,钱榕.基于统计语言模型改进的Word2Vec优化策略研究[J].中文信息学报,2019,0(7):11-19. 被引量：13
8赖胜强,唐雪梅.舆情事件中网民评论的社会影响研究[J].情报杂志,2020,39(2):103-107. 被引量：17
9李泉,李萌,成洪权,蒋林秀,肖舒婷,王極可.基于文本聚类与情感分析的群租房微博舆情量化研究[J].图书情报研究,2019,12(1):82-89. 被引量：4
10李晚莲,高光涵.突发事件网络舆情研究进展与趋势分析[J].重庆邮电大学学报（社会科学版）,2019,31(5):60-68. 被引量：13

二级参考文献194

1李健,曹垚,王宗敏,王广印.融合k-means聚类和Hausdorff距离的散乱点云精简算法[J].武汉大学学报（信息科学版）,2020,45(2):250-257. 被引量：16
2李凯,李昆仑,崔丽娟.模型聚类及在集成学习中的应用研究[J].计算机研究与发展,2007,44(z2):203-207. 被引量：7
3左晓飞,刘怀亮,范云杰,赵辉.基于概念语义场的文本聚类算法研究[J].情报杂志,2012,31(5):180-184. 被引量：2
4闫强,孟跃.在线评论的感知有用性影响因素——基于在线影评的实证研究[J].中国管理科学,2013,21(S1):126-131. 被引量：67
5陈悦,陈超美,刘则渊,胡志刚,王贤文.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253. 被引量：7261
6邱均平,文庭孝,周黎明,张洋,张蕊.2003年国内外情报学研究新进展[J].图书馆论坛,2004,24(6):25-30. 被引量：36
7马慧芳,祁云平,杨小东.一种基于文本关系图的多文档自动摘要技术[J].情报杂志,2007,26(3):67-69. 被引量：7
8张勤,马费成.国外知识管理研究范式——以共词分析为方法[J].管理科学学报,2007,10(6):65-75. 被引量：482
9徐洪军,薛东琦.私法公法化视野下的公权干预私权——从上海市政府介入“群租房”现象考察[J].长春理工大学学报（社会科学版）,2008,21(2):69-72. 被引量：4
10姚天昉,程希文,徐飞玉,汉思·乌思克尔特,王睿.文本意见挖掘综述[J].中文信息学报,2008,22(3):71-80. 被引量：106

共引文献404

1方玉婵,梁先锋,褚建勋,安彦青,黄婧晔,陈昕悦,刘益东.社交媒体自然灾害传播中的地域舆论感知差异研究:基于“四川凉山州森林火灾事件”的实证分析[J].中国网络传播研究,2021(4):207-233. 被引量：1
2卢功靖,卢林艳,李媛媛,王成军.基于议题类型的临近预测:使用社交媒体预测新冠肺炎疫情确诊人数[J].中国网络传播研究,2021(4):93-117. 被引量：1
3周金连,王静君.早期参与者的力量:对公共事件微博舆情演化周期的研究[J].中国网络传播研究,2021(1):127-152.
4董宇,杨景升,秦彤昱,郭海博.基于文本关键词提取的自驾车营地行业标准讨论——以《自驾车旅居车营地质量等级划分》为例[J].中国标准化,2021(8):125-132. 被引量：1
5曾志伟,刁明光,王欣鹏,何炳辉.基于口罩评论数据的用户情感趋势与关注分析[J].计算机系统应用,2020,29(12):263-267.
6张宗毅.农机“卡脖子”技术识别:综述与展望[J].农业农村部管理干部学院学报,2022(2):34-40.
7孙锐,和世华,李祥华,邰先常.基于爬虫技术“雪茄”关注热点的社会化网络及时空演化分析[J].农村经济与科技,2020,31(24):213-216. 被引量：3
8闫博.基于HanLP关键词抽取与句法分析的图谱构建[J].电子元器件与信息技术,2022,6(9):77-80. 被引量：3
9雍龙泉,贾伟,张建科.基于爬虫技术与智能算法的网络舆情监测[J].智能计算机与应用,2021,11(4):35-38. 被引量：3
10骆梅柳.基于大数据的校园舆情热点话题跟踪研究[J].智能计算机与应用,2020(8):287-289. 被引量：1

同被引文献104

1王琳炜.突发性公共事件微博舆情中热点网民关注偏好研究[J].知识管理论坛,2020(5):271-282. 被引量：4
2沈石,宋长青,程昌秀,高剑波,叶思菁.GDELT:感知全球社会动态的事件大数据[J].世界地理研究,2020,0(1):71-76. 被引量：29
3徐红,张斯婷,李凌方.基于LDA模型与共词分析法的农村阅读推广主题发现与热点分析[J].情报科学,2022,40(10):67-73. 被引量：16
4孙菲.公共危机治理中的网络舆情引导困境与解决理路[J].福建论坛（人文社会科学版）,2020(12):184-192. 被引量：14
5谢耘耕,徐颖.新媒体环境下突发公共事件的信源管理研究[J].新闻与传播研究,2011,18(4):58-67. 被引量：41
6聂智,曾长秋.论虚拟社会治理中自媒体舆情引导[J].学术论坛,2011,34(12):190-194. 被引量：30
7路荣,项亮,刘明荣,杨青.基于隐主题分析和文本聚类的微博客中新闻话题的发现[J].模式识别与人工智能,2012,25(3):382-387. 被引量：67
8李劲,张华,吴浩雄,向军.基于特定领域的中文微博热点话题挖掘系统BTopicMiner[J].计算机应用,2012,32(8):2346-2349. 被引量：26
9孙玲芳,周加波,徐会,许锋,候志鲁.基于改进K-means的网络舆情热点事件发现技术[J].计算机与现代化,2014(4):143-147. 被引量：7
10王丹,张海涛,刘雅姝,任亮.微博舆情关键节点情感倾向分析及思想引领研究[J].图书情报工作,2019,63(4):15-22. 被引量：17

引证文献7

1林小坚.面向微博网络舆情的热门话题检测系统框架研究[J].电子技术与软件工程,2021(10):163-164. 被引量：2
2权学烽,宋晓谕,王鹏龙,白光祖,王宝.基于多源数据的疫情下中美两国热点话题变化分析[J].科技传播,2021,13(15):6-13.
3李珊珊,刘丁宁,祁瑞华,于莹莹.基于文本挖掘的重大公共卫生事件网络舆情特征分析及治理探索[J].情报探索,2021(12):27-36. 被引量：3
4朱晓卉,胡彦蓉,刘洪久.基于微博核心实体的情感分析方法及引导机制研究[J].情报科学,2022,40(3):136-143. 被引量：14
5周丽,张锦,姚琼,段全伟.我国民族传统体育文化网络传播困境与突围进路[J].广州体育学院学报,2023,43(2):52-61. 被引量：11
6贾梦媛,杨翠芬.基于主题挖掘与情感分析的生鲜物流服务质量研究——以京东生鲜为例[J].现代商业,2024(17):56-62.
7谢婷,罗清.基于机器学习的新型冠状肺炎的舆情分析[J].数据挖掘,2022,12(2):114-122.

二级引证文献30

1赵波涛.人工智能背景下网络舆情的监测与分析[J].卫星电视与宽带多媒体,2021(19):95-96.
2宣金荣,王龙,周庆阳,张莹,昌雅丽.基于用户影响力的网络论坛热点话题检测[J].信息与电脑,2021,33(22):44-46.
3岳扬,山成虎,彭春霖,郑小琳,闫玉玺,谷琼.基于新浪微博数据的东航MU5735坠毁事件舆情热度演化及情感分析[J].计算机时代,2023(2):55-60. 被引量：1
4徐娟,刘东华,刘宇.基于典籍文本挖掘的明清时期色彩知识研究[J].图书馆论坛,2023,43(3):42-53. 被引量：2
5余清.基于社会网络的网络舆情挖掘技术与应用研究[J].长江信息通信,2023,36(2):165-167. 被引量：2
6陆颖颖,易明,李梓奇,张展豪,李旭光.基于人类动力学的微博用户评论行为研究[J].情报科学,2023,41(2):157-168. 被引量：3
7徐博.基于信息检索与数据挖掘的食品安全舆情监测与引导:以大型农贸市场食品安全微博舆情实证研究为例[J].食品科学,2023,44(7):404-412. 被引量：2
8周瑛,严林志.重大突发事件网络舆情演化研究——基于信息生态理论[J].电脑知识与技术,2023,19(14):73-75. 被引量：1
9马晶晶,肖萌,陈树广.情感视域下突发公共事件网络舆情情感分析与主题演化研究[J].情报探索,2023(8):61-68.
10杨沁蓉,朱光,雍华贵.基于主题-情感融合模型的网络舆情演化研究——以“钟薛高雪糕事件”为例[J].情报探索,2023(8):111-119.

1李金海,胡旭.基于百度贴吧的高校网络舆情热点话题分析[J].计算机与现代化,2020(9):12-18. 被引量：3
2杜秀娟.网络视域下中国网民的政治认知——基于“新长征路上有我”话题分析[J].时代人物,2020(14):51-52.
3杨庆春.健康饮食话题作文探究(1)[J].初中生学习指导,2020(11):36-37.
4李长荣,纪雪梅.面向突发公共事件网络舆情分析的领域情感词典构建研究[J].数字图书馆论坛,2020(9):32-40. 被引量：16
5任东亮,林绍福,黄鸿发,付钰.基于知识图谱的抗疫意见领袖热点话题检测与分析[J].软件导刊,2020,19(10):20-24. 被引量：7
6无.锁上科技,超凡所见|汇泰龙2020年新品发布会圆满成功![J].五金科技,2020,48(5):38-41.
7陈璟浩,陈美合,曾桢.突发公共卫生事件中中国网民关注度分析——基于新冠肺炎网络舆情数据[J].现代情报,2020,40(10):11-21. 被引量：20
8林锋.传统文化话题作文探究[J].初中生学习指导,2020(30):40-41.
9戴佳毅,古建祥.UGC模式下主流媒体如何画好满足受众与坚持导向的同心圆[J].新闻研究导刊,2020,11(20):1-2. 被引量：1
10杨爱红.滚装船运输重装备,我们与美军还有多大差距?[J].现代舰船,2020(19):124-128. 被引量：1

武汉大学学报（理学版）

2020年第5期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部