-
题名基于主题—情感挖掘模型的微博评论情感分类研究
被引量:18
- 1
-
-
作者
朱晓霞
宋嘉欣
孟建芳
-
机构
燕山大学
-
出处
《情报理论与实践》
CSSCI
北大核心
2019年第5期159-164,共6页
-
基金
国家自然科学基金项目"公共危机中伪信息的扩散机理与控制研究"(项目编号:71301140)
河北省自然科学基金项目"公共危机伪信息扩散的网络拓扑与情景应对模型研究"(项目编号:G2015203425)
河北省教育厅科学研究计划项目河北省高等学校青年拔尖人才计划"网络协同下的智能制造资源共享体系架构与优化设计"(项目编号:BJ2017082)的研究成果
-
文摘
[目的/意义]近些年来,随着互联网的快速发展,微博逐渐成为人们发表言论的一个社交网络平台。通过对大量评论信息进行情感分析,对政府进行舆情治理、企业市场决策和消费行为分析具有十分重要的意义。[方法/过程]文章针对微博评论表达的特点,提出一种基于主题—情感挖掘模型的无监督情感分类方法,通过将语义角色标注、TF-IDF和K-means聚类方法相结合,构建情感单元词表和主题—情感匹配词表,同时挖掘出评论中主题和情感的分布与联系,并利用点互信息(Pointwise Mutual Information,PMI)和情感词典的方法计算主题词的情感极性值,基于此进行情感分类。[结果/结论]经实验证明,该方法同时考虑了评论中的主题分布与情感极性信息,解决了主题模型中常见的数据稀疏问题,提高了情感分类的效率和准确性,在F值上比S-LDA模型提高了14.24%。
-
关键词
微博
主题—情感挖掘模型
语义角色标注
TF-IDF
K-MEANS算法
情感分类
-
Keywords
micro-blog
theme-emotion mining model
semantic role labeling
TF-IDF
K-means algorithm
sentiment classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-