基于主题与情感联合预训练的虚假评论检测方法被引量：3

Fake Review Detection Based on Joint Topic and Sentiment Pre-Training Model

下载PDF

导出

摘要商品评论信息是用户线上决策的重要依据,但在利益的驱使下商家往往会通过雇佣专业的写手撰写大量虚假评论的方式来误导用户,进而达到包装自己或诋毁竞争对手的目的.这种现象会造成不正当的商业竞争和极差的用户体验.针对这一现象,我们通过情感预训练的方法对现有的虚假评论识别模型进行了改进,并提出了一种能够同时整合评论语义和情感信息的联合预训练学习方法.鉴于预训练模型强大的语义表示能力,在联合学习框架中采用了2种预训练模型编码器分别用于抽取评论的语义和情感上下文特征,并通过联合训练的方法整合2种特征,最后使用Center Loss损失函数对模型进行优化.在多个公开数据集和多个不同任务上进行了验证实验,实验表明提出的联合模型在虚假评论检测与情感极性分析任务上都取得了目前最好的效果且具有更强的泛化能力. Product review information is an important basis for users online decision-making.However,driven by profit,businesses often hire professional writers to write a large number of fake reviews to mislead users and achieve the purpose of packaging themselves and denigrating competitors,resulting in unfair business competition and extremely poor user experience.In response to this phenomenon,we improved the existing spam review recognition methods through Pre-training Models,and proposed a joint pre-training learning method that can simultaneously integrate the semantic and sentimental information of product reviews.In view of the powerful semantic representation capabilities of the pre-trained model,we apply two pre-trained encoders to extract the semantic and emotional features of reviews in the joint learning framework.We integrate the two types of features through joint pre-training learning method.Apart from that,we add the Center Loss function to optimize the model.We have conducted several verification experiments on multiple public data sets and multiple different tasks.The experiments show that our proposed joint model has achieved the best results and has a stronger generalization in both fake review detection and sentiment analysis tasks.

作者张东杰黄龙涛张荣薛晖林俊宇路瑶 Zhang Dongjie;Huang Longtao;Zhang Rong;Xue Hui;Lin Junyu;Lu Yao(Alibaba Group,Beijing 100102;Institute of Information Engineering,Chinese Academy of Sciences,Beijing 100093;Langfang Polytechnic Institute,Langfang,Hebei 065001)

机构地区阿里巴巴集团中国科学院信息工程研究所廊坊职业技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2021年第7期1385-1394,共10页 Journal of Computer Research and Development

基金廊坊市科技支撑计划项目(2020011005)。

关键词虚假评论检测预训练模型情感分析联合训练 Center Loss fake review detection pre-training model sentiment analysis joint learning framework Center Loss

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1缪裕青,欧威健,刘同来,刘水清,文益民.基于情感极性与SMOTE过采样的虚假评论识别方法[J].计算机应用研究,2018,35(7):2042-2045. 被引量：16
2任亚峰,尹兰,姬东鸿.基于语言结构和情感极性的虚假评论识别[J].计算机科学与探索,2014,8(3):313-320. 被引量：27
3赵军,王红.融合情感极性和逻辑回归的虚假评论检测方法[J].智能系统学报,2016,11(3):336-342. 被引量：16
4曾致远,卢晓勇,徐盛剑,陈木生.基于多层注意力机制深度学习模型的虚假评论检测[J].计算机应用与软件,2020,37(5):177-182. 被引量：4

二级参考文献11

1何凤英.基于语义理解的中文博文倾向性分析[J].计算机应用,2011,31(8):2130-2133. 被引量：18
2谭文堂,朱洪,葛斌,李芳芳,肖卫东.垃圾评论自动过滤方法[J].国防科技大学学报,2012,34(5):153-157. 被引量：15
3宋海霞,严馨,余正涛,石林宾,苏斐.基于自适应聚类的虚假评论检测[J].南京大学学报（自然科学版）,2013,49(4):433-438. 被引量：33
4任亚峰,尹兰,姬东鸿.基于语言结构和情感极性的虚假评论识别[J].计算机科学与探索,2014,8(3):313-320. 被引量：27
5邸鹏,李爱萍,段利国.基于转折句式的文本情感倾向性分析[J].计算机工程与设计,2014,35(12):4289-4295. 被引量：17
6陈燕方,娄策群.在线商品虚假评论形成路径研究[J].现代情报,2015,35(1):49-53. 被引量：20
7唐波,陈光,王星雅,王非,陈小慧.微博新词发现及情感倾向判断分析[J].山东大学学报（理学版）,2015,50(1):20-25. 被引量：8
8邵珠峰,姬东鸿.基于情感特征和用户关系的虚假评论者的识别[J].计算机应用与软件,2016,33(5):158-161. 被引量：19
9赵军,王红.融合情感极性和逻辑回归的虚假评论检测方法[J].智能系统学报,2016,11(3):336-342. 被引量：16
10栾杰,付晓东,冯旭鹏,刘利军,黄青松,刘晓梅.基于多元特征的电商低质量商品评论识别[J].计算机应用与软件,2017,34(2):100-105. 被引量：1

共引文献45

1陈颖,侯惠敏,李援南.基于条件随机场的虚假评论识别研究[J].北京电子科技学院学报,2017,25(2):47-50. 被引量：2
2皇苏斌,修宇,赵森严,汪千松.基于多维特征权重的虚假评论识别方法[J].长江大学学报（自科版）（上旬）,2015,12(6):34-38. 被引量：2
3邓松,万常选,关爱浩,陈辉.基于行为与内容的科技产品虚假评论识别[J].小型微型计算机系统,2015,36(11):2498-2503. 被引量：4
4张李义,刘畅.结合深度置信网络和模糊集的虚假交易识别研究[J].现代图书情报技术,2016(1):32-39. 被引量：5
5赵军,王红.融合情感极性和逻辑回归的虚假评论检测方法[J].智能系统学报,2016,11(3):336-342. 被引量：16
6石文华,龚雪,张绮,王璐.在线初次评论与在线追加评论的比较研究[J].管理科学,2016,29(4):45-58. 被引量：35
7李志宇,梁循,周小平.基于属性主题分割的评论短文本词向量构建优化算法[J].中文信息学报,2016,30(5):101-110. 被引量：6
8栾杰,付晓东,冯旭鹏,刘利军,黄青松,刘晓梅.基于多元特征的电商低质量商品评论识别[J].计算机应用与软件,2017,34(2):100-105. 被引量：1
9朱娟.在线商品虚假评论关键问题研究综述[J].现代情报,2017,37(5):166-171. 被引量：6
10刘臣,安咏雪,韩林.在线数字内容传播过程中社会影响作用的度量研究[J].软件,2017,38(9):12-17.

同被引文献43

1李实,叶强,李一军,罗嗣卿.挖掘中文网络客户评论的产品特征及情感倾向[J].计算机应用研究,2010,27(8):3016-3019. 被引量：69
2苗光胜,冯登国,苏璞睿.P2P信任模型中基于模糊逻辑的共谋团体识别方法[J].计算机研究与发展,2011,48(12):2187-2200. 被引量：8
3王祖辉,姜维,李一军.在线评论情感分析中固定搭配特征提取方法研究[J].管理工程学报,2014,28(4):180-186. 被引量：26
4王倩倩.一种在线商品评论信息可信度的排序方法[J].情报杂志,2015,34(3):181-185. 被引量：14
5富越,董保华.电子商务垃圾评论者识别研究[J].科学决策,2015(9):79-94. 被引量：4
6王忠群,乐元,修宇,皇苏斌,汪千松.基于模板用户信息搜索行为和统计分析的共谋销量欺诈识别[J].现代图书情报技术,2015(11):41-50. 被引量：6
7郭顺利,张向先,李中梅.面向用户信息需求的移动O2O在线评论有用性排序模型研究——以美团为例[J].图书情报工作,2015,59(23):85-93. 被引量：29
8金燕,闫婧.基于用户信誉评级的UGC质量预判模型[J].情报理论与实践,2016,39(3):10-14. 被引量：15
9邵珠峰,姬东鸿.基于情感特征和用户关系的虚假评论者的识别[J].计算机应用与软件,2016,33(5):158-161. 被引量：19
10索琪,郭进利.在线社交网络资源评论关系超网络演化模型[J].系统管理学报,2016,25(5):852-857. 被引量：5

引证文献3

1张玉莹,朱广丽,张友强,孙争艳,张顺香.基于情感信息预处理和Bi-GRU的虚假评论识别模型[J].广西科学,2023,30(1):169-176. 被引量：2
2杜姗,杨敏,仇蓉蓉.基于SMOTE-RF与多维特征向量的在线商品虚假评论识别研究[J].情报杂志,2023,42(4):156-164. 被引量：4
3韩宇.基于目标终端与社交数据的虚假用户检测技术[J].软件,2023,44(4):145-147.

二级引证文献6

1汪鹏,邓钰佳,方兴华.在线评论识别用户需求的研究热点与前沿分析[J].标准科学,2023(5):111-116.
2田径,李玮嘉,常云翼,张岳坤.导向性股评识别的统计测度研究[J].时代金融,2023(11):81-83.
3卫善春.基于数据挖掘的就业需求信息资源采集研究[J].情报科学,2023,41(9):130-137.
4郑森,齐晓轩,柳亿霖.非平衡情感数据背景下基于边界度的过采样方法[J].价值工程,2023,42(31):129-131.
5周毅勇.电子商务产品评论情感分析模型的研究与构建[J].网络安全技术与应用,2024(1):50-53. 被引量：1
6陈润萌,宋益善,王胤哲,梁靖韵.基于ETW⁃BERT模型的网购商品虚假评论识别[J].现代计算机,2024,30(3):83-89.

1牟建翔.浅析供应链管理对提升企业核心竞争力的研究[J].市场周刊·理论版,2020(84):14-14.
2朱琳.基于4C/ID模型的scratch任务驱动法教学设计[J].计算机教育,2021(7):103-106. 被引量：1
3王雷,陈大文.面向电商平台的营销水军集成识别研究[J].电子技术与软件工程,2021(11):253-256.
4矫健,张磊,李晶.基于空洞空间金字塔池化的雾天图像语义分割[J].计算机应用研究,2021,38(7):2200-2202. 被引量：2
5潘梅.基于BERT-BiLSTM的网民情绪识别[J].电脑知识与技术,2021,17(18):74-76. 被引量：2
6付鑫,郭阳,聂玲,王思宁,王小滨,杨滨名.基于知识图谱技术的电网运营监测分析系统设计[J].供用电,2021,38(7):45-50. 被引量：9
7李吉,姚姗姗.设计管理在商业展示设计中的应用研究[J].商展经济,2021(13):85-87.
8郭军成,万刚,胡欣杰,魏展基.基于BERT的中文简历命名实体识别[J].计算机应用,2021,41(S01):15-19. 被引量：11
9杨继红.网络众包平台的运营模式及创新效应[J].科技与金融,2021(6):84-89.
10潘芳,张会兵,董俊超,首照宇.基于高效Transformer的中文在线课程评论方面情感分析[J].计算机科学,2021,48(S01):264-269. 被引量：5

计算机研究与发展

2021年第7期

浏览历史

内容加载中请稍等...

基于主题与情感联合预训练的虚假评论检测方法被引量：3

参考文献4

二级参考文献11

共引文献45

同被引文献43

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于主题与情感联合预训练的虚假评论检测方法 被引量：3

参考文献4

二级参考文献11

共引文献45

同被引文献43

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于主题与情感联合预训练的虚假评论检测方法被引量：3