基于分层语义特征学习模型的微博谣言事件检测被引量：3

Data Analysis and Knowledge Discovery Detecting Weibo Rumors Based on Hierarchical Semantic Feature Learning Model

导出

摘要【目的】提高微博谣言事件检测的准确率和时效性。【方法】提出一种基于分层语义特征学习模型的微博谣言事件检测方法。首先,基于BERT预训练模型抽取事件中单条文本信息的语义特征;其次,基于时间域对事件传播数据进行动态划分,利用卷积神经网络挖掘各时间域中的文本集合的语义相关性特征;然后,把各时间域内的语义相关性特征输入深层双向门控循环神经网络,学习事件传播过程中的深层语义时序特征;最后,融合Attention机制使模型更加关注于语义时序特征中具有谣言特征的部分。【结果】在Weibo公开数据集上的实验结果表明,该模型的检测准确率达到95.39%,检测时延在12h以内。【局限】模型需要一定数量的转发评论信息,事件热度不够时检测效果不突出。【结论】分层语义特征学习模型实现了从局部语义到全局语义的学习过程,提升了微博谣言事件检测的性能。 [Objective]This paper tries to improve the accuracy and timeliness of Weibo rumor detection.[Methods]We proposed a rumor detection method based on the hierarchical semantic feature learning model(BCGA).Firstly,we extracted the semantic features of a single text in an event based on the BERT model.Secondly,we dynamically grouped the event propagation data based on the time domain.Next,we used the convolutional neural network to learn the semantic correlation features of the text sets in each time domain.Fourth,we input the semantic correlation features in each time domain into the deep bidirectional gated recurrent neural network to learn the deep semantic temporal features of the event propagation process.Finally,we integrated the attention mechanism to make the model focus on the rumor feature in semantic temporal features.[Results]Experiments on the Weibo public data sets show that the detection accuracy of the model reached 95.39%,while the detection delay was within 12 hours.[Limitations]The model requires a certain amount of forwarding and commenting information and the detection effect is not prominent when the event is not popular enough.[Conclusions]The hierarchical semantic feature learning model achieves a learning process from local to global semantics,improving the performance of Weibo rumor detection.

作者黄学坚马廷淮王根生 Huang Xuejian;Ma Tinghuai;Wang Gensheng(College of Software,Nanjing University of Information Science&Technology,Nanjing 210044,China;VR College of Modern Industry,Jiangxi University of Finance and Economics,Nanchang 330013,China;College of Humanities,Jiangxi University of Finance and Economics,Nanchang 330013,China)

机构地区南京信息工程大学软件学院江西财经大学虚拟现实(VR)现代产业学院江西财经大学人文学院

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2023年第5期81-91,共11页 Data Analysis and Knowledge Discovery

基金国家重点研发计划(项目编号:2021YFE0104400) 国家自然科学基金项目(项目编号:72061015) 江西省教育厅科技项目(项目编号:GJJ200539)的研究成果之一。

关键词谣言检测深度学习语义特征时序数据分层语义 Rumor Detection Deep Learning Semantic Features Temporal Data Hierarchical Semantic

分类号 TP393 [自动化与计算机技术—计算机应用技术] G250 [文化科学—图书馆学]

引文网络
相关文献

参考文献11

1李力钊,蔡国永,潘角.基于C-GRU的微博谣言事件检测方法[J].山东大学学报（工学版）,2019,49(2):102-106. 被引量：21
2刘知远,张乐,涂存超,孙茂松.中文社交媒体谣言统计语义分析[J].中国科学：信息科学,2015,45(12):1536-1546. 被引量：46
3谢柏林,蒋盛益,周咏梅,谢逸,李霞.基于把关人行为的微博虚假信息及早检测方法[J].计算机学报,2016,39(4):730-744. 被引量：18
4尹鹏博,潘伟民,彭成,张海军.基于用户特征分析的微博谣言早期检测研究[J].情报杂志,2020,39(7):81-86. 被引量：23
5黄学坚,王根生,罗远胜,闵潞,吴小芳,李志鹏.融合多元用户特征和内容特征的微博谣言实时检测模型[J].小型微型计算机系统,2022,43(12):2518-2527. 被引量：6
6李奥,但志平,董方敏,刘龙文,冯阳.基于改进生成对抗网络的谣言检测方法[J].中文信息学报,2020,34(9):78-88. 被引量：13
7曾子明,王婧.基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例[J].情报学报,2019,38(1):89-96. 被引量：54
8马鸣,刘云,刘地军,白健.基于主题和预防模型的微博谣言检测[J].北京理工大学学报,2020,40(3):310-315. 被引量：10
9祖坤琳,赵铭伟,郭凯,林鸿飞.新浪微博谣言检测研究[J].中文信息学报,2017,31(3):198-204. 被引量：20
10贺刚,吕学强,李卓,徐丽萍.微博谣言识别研究[J].图书情报工作,2013,57(23):114-120. 被引量：35

二级参考文献74

1任一奇,王雅蕾,王国华,冯伟.微博谣言的演化机理研究[J].情报杂志,2012,31(5):50-54. 被引量：40
2邓国峰,唐贵伍.网络谣言传播及其社会影响研究[J].求索,2005(10):88-90. 被引量：59
3朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
4胡钰.大众传播效果[M]{H}北京:新华出版社,2000120-121.
5Castillo C,Mendoza M,Poblete B. Information credibility on Twitter[A].New York:ACL,2011.675-684.
6Qazvinian V,Rosengren E,Radev D R. Rumor has it:Identifying misinformation in microblogs[A].Edinburgh:ACL,2011.1589-1599.
7Mendoza M,Pdblete B,Castillo C. Twitter under crisis:Can we trust what we RT[A].New York:ACL,2010.71-79.
8Takahashi T,Igata N. Rumor detection on Twitter[A].Kobe:IEEE,2012.452-457.
9Yang Fan,Liu Y,Yu X. Automatic detection of rumor on Sina Weibo[A].Beijing:ACM,2012.1-7.
10Wang A H. Don't follow me:Spam detection in Twitter[A].Athens:SciThePress,2010.142-151.

共引文献198

1王建英,张辉.基于社会化媒体的众包灾害医学救援初探[J].灾害医学与救援（电子版）,2014(3):162-164.
2杨利君,滕冲.基于增强的双向树表示的推特谣言立场检测模型[J].中文信息学报,2021,35(10):119-127.
3万齐斌,胡枫,周马特.面向推特平台的谣言检测综述[J].信息通信,2019,0(12):137-139. 被引量：1
4陈昌凤,师文.智能化新闻核查技术:算法、逻辑与局限[J].新闻大学,2018(6):42-49. 被引量：31
5段大高,王长生,韩忠明,李斌.基于微博评论的虚假消息检测模型[J].计算机仿真,2016,33(1):386-390. 被引量：9
6路同强,石冰,闫中敏,周珮.一种用于微博谣言检测的半监督学习算法[J].计算机应用研究,2016,33(3):744-748. 被引量：3
7陶成.“量身”服务助力老年读者识别社交平台谣言[J].当代图书馆,2016,0(4):4-6. 被引量：2
8王一华.社交媒体信息可信度评估研究综述[J].现代情报,2016,36(12):164-169. 被引量：4
9孙宇.大数据时代我国移动社交媒体产业安全问题探析[J].北京印刷学院学报,2017,25(1):7-11.
10武庆圆,何凌南.基于多标签双词主题模型的短文本谣言分析研究[J].情报杂志,2017,36(3):92-97. 被引量：8

同被引文献29

1王国华,王丽丽,王雅蕾.基于新浪平台的微博辟谣主体与方式研究[J].电子政务,2013(9):2-8. 被引量：14
2李宗建,程竹汝.新媒体时代舆论引导的挑战与对策[J].上海行政学院学报,2016,17(5):76-85. 被引量：67
3祖坤琳,赵铭伟,郭凯,林鸿飞.新浪微博谣言检测研究[J].中文信息学报,2017,31(3):198-204. 被引量：20
4李慧,柴亚青.基于属性特征的评论文本情感极性量化分析[J].数据分析与知识发现,2017,1(10):1-11. 被引量：16
5刘雅辉,靳小龙,沈华伟,鲍鹏,程学旗.社交媒体中的谣言识别研究综述[J].计算机学报,2018,41(7):1536-1558. 被引量：37
6唐雪梅,赖胜强.突发事件中政府对网络谣言的辟谣策略研究——以太伏中学事件为例[J].情报杂志,2018,37(9):95-99. 被引量：32
7郭蓉,王卫明.新媒体图像谣言的特征、成因、危害及对策——以60起图像谣言事件为研究样本[J].青年记者,2020(3):31-32. 被引量：3
8林萍,王晓梅,魏静.基于社群结构比较的意见领袖协作网络分析[J].宁夏社会科学,2020,0(2):193-205. 被引量：7
9胡斗,卫玲蔚,周薇,淮晓永,韩冀中,虎嵩林.一种基于多关系传播树的谣言检测方法[J].计算机研究与发展,2021,58(7):1395-1411. 被引量：13
10冯雯璐.虚假新闻智能化治理的合法性与合理性[J].青年记者,2021(15):75-78. 被引量：4

引证文献3

1贺国秀,任佳渝,李宗耀,林晨曦,蔚海燕.以可解释工具重探基于深度学习的谣言检测[J].数据分析与知识发现,2024,8(4):1-13. 被引量：1
2段可霓,周怡洁,俞定国,闫燕勤.我国辟谣领域研究概述——基于CNKI文献的数据可视化分析[J].新媒体研究,2024,10(6):6-11.
3王根生,朱奕,李胜.一种融合知识图谱的图注意力神经网络谣言实时检测方法[J].数据分析与知识发现,2024,8(6):95-106. 被引量：1

二级引证文献2

1段可霓,周怡洁,俞定国,闫燕勤.我国辟谣领域研究概述——基于CNKI文献的数据可视化分析[J].新媒体研究,2024,10(6):6-11.
2王松,焦海燕,刘新民.融合外部知识图谱的多模态知识共创价值识别研究[J].情报理论与实践,2024,47(11):139-149.

1叶娜,俞定国,陈晶,叶斌.基于社交媒体平台的辟谣效果影响因素分析及实证研究[J].情报探索,2023(5):53-60. 被引量：1
2山东省新媒体影响力2023年7月榜单及解读[J].全媒体探索,2023(8):142-147.
3李艳君,张海军,潘伟民.基于用户行为特征的微博谣言检测[J].计算机与数字工程,2023,51(4):850-854.
4崔艳林,林旭,郭俊宏,周煜捷.结合ChineseBERT的多尺度语义协同电网故障文本分类模型[J].微型电脑应用,2023,39(8):64-67.
5王鹏翔,叶鸥,黄山阁,马志强.社交网络突发谣言传播动力学建模与分析[J].西安科技大学学报,2023,43(3):637-646.
6徐永昌,黄士多,艾浩军.基于对比学习的社交媒体地理位置预测方法[J].电信科学,2023,39(8):58-68. 被引量：1
7吴文臻.煤矿井下群机器人高效任务分配算法[J].工矿自动化,2023,49(8):60-69.

数据分析与知识发现

2023年第5期

浏览历史

内容加载中请稍等...

基于分层语义特征学习模型的微博谣言事件检测被引量：3

参考文献11

二级参考文献74

共引文献198

同被引文献29

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于分层语义特征学习模型的微博谣言事件检测 被引量：3

参考文献11

二级参考文献74

共引文献198

同被引文献29

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于分层语义特征学习模型的微博谣言事件检测被引量：3