期刊文献+

一种基于多重词典的中文文本情感特征抽取方法 被引量:10

A Method of Emotional Feature Extraction in Chinese Text Based on Multiple Lexicons
下载PDF
导出
摘要 情感特征抽取是文本情感分类的重要步骤,正确的选择情感特征并赋予合理的情感权重是保障分类精度的前提。利用基础情感词词典、连词词典及词语距离,提出了一种基于多重词典的中文文本情感特征抽取算法,实验证明该方法优于HM,SO-PMI和词语语义距离等经典的特征抽取算法。 Emotional feature extraction is an important step in text sentiment classification,so choosing emotional feature correctly and giving a reasonable sentiment weight are the premise to guarantee classification precision.A Chinese text emotional feature extraction algorithm is proposed based on multiple lexicons including basic semantic lexicon,conjunction lexicon and word distance.The experiment results show that the algorithm outperforms some classic feature extraction algorithms of HM,SO-PMI and word semantic distance etc.
出处 《湖南工业大学学报》 2011年第2期42-46,共5页 Journal of Hunan University of Technology
基金 湖南省自然科学基金资助项目(10JJ3002) 中国包装总公司科研基金资助项目(2008-XK13)
关键词 情感特征 情感权重 多重词典 情感特征抽取算法 emotional feature sentiment weight multiple lexicons emotional feature extraction algorithm
  • 相关文献

参考文献9

  • 1Hatzivassiloglou V.McKeown K R.Predicting the Semantic Orientation of Adjeetives[C]//Proceextings of the 35th Annual Meeting of the ACL and the 8th Conference of the European Chapter of the ACL.Stroudsburg.PA,USA:Association for Computational Linguistics,1997:174-181.
  • 2Turney Peter.Thumbs Up or Thumbs Down Semantic Orientation Applied to Unsupervised Classification of Reviews[C]//Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics.USA:Association for Computational Linguistics.2002:417-424.
  • 3姚天昉,娄德成.汉语情感词语义倾向判别的研究[C]//中国计算技术与语言问题研究-第七届中文信息处理国际会议论文集,武汉:2007.
  • 4柳位平,朱艳辉,栗春亮,向华政,文志强.中文基础情感词词典构建方法研究[J].计算机应用,2009,29(10):2875-2877. 被引量:86
  • 5ICTCLAS项目组..ICTCLAS汉语分词系统[EB/OL]..http://ictclas.org/news_ictclas__publish.html,,[2008-09-03]..
  • 6谭松波..中文情感挖掘语料库-ChnSentiCorp[EB/OL]..http://www.searchforum.org.cn/tansongbo/corpus-senti.htm,,[2010-06-29]..
  • 7宋乐,何婷婷.中文情感词句识别及文本观点抽取研究[C]..第二届中文倾向性分析评测会议.上海:中国中文信息学会信息检索专业委员会,2009.30-37.
  • 8王鹏,樊兴华.中文文本分类中利用依存关系的实验研究[J].计算机工程与应用,2010,46(3):131-133. 被引量:16
  • 9焦庆争,蔚承建.一种可靠信任推荐文本分类特征权重算法[J].计算机应用研究,2010,27(2):472-474. 被引量:6

二级参考文献23

  • 1林鸿飞,杨志豪,赵晶.基于内容和合作模式的信息推荐机制[J].中文信息学报,2005,19(1):48-55. 被引量:14
  • 2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量:326
  • 3KU L-W, LO Y-S, CHEN H-H. Using polarity scores of words for sentence-level opinion extraction [ C]// Proceedings of the 6th NTCIR-6 Workshop Meeting. Toyko, Japan: [ s. n. ], 2007:316 - 322.
  • 4王秉卿,张姝,张奇.中文情感词识别[C]//NCIRCS2008:第四届全国信息检索与内容安全学术会议.北京:[出版社不详],2008:63-69.
  • 5刘群 李素建.基于《知网》的词汇语义相似度的计算.中文计算语言学,2002,17(2):59-76.
  • 6王克,张春良,朱慕华,等.基于情感词词典的中文文本主客观分析[C].NCIRCS2008:第四届全国信息检索与内容安全学术会议.北京,2008.56-62.
  • 7知网[EB/OL].[2009-03-12].http://www.keenage.com.
  • 8TURNEY P D. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews [ C]// Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics. Morristown, N J, USA: Association for Computational Linguistics, 2002:417-424.
  • 9谭松波.中文情感挖掘语料-ChenSentiCorp[EB/OL].(2008-12-19)[2009-03-12].http://www.searchforum.org.cn/tansongbo/corpus-senti.htm.
  • 10KAJI N, KITSUREGAWA M. Building lexicon for sentiment analysis from massive collection of HTML documents [ C/OL]//EMNLPCoNLL 2007: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. 2007:1075 - 1083 [2009 -03 -08]. http://www. aclweb. org/anthology/D/D07/D07-1115. pdf.

共引文献108

同被引文献101

引证文献10

二级引证文献89

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部