面向倾向性分析的基于词聚类的基准词选择方法被引量：7

Paradigm words selecting method based on word clustering for sentiments analysis

下载PDF

导出

摘要现有的基准词选择方法存在着随机性和主观性的缺陷,提出了一种基于词聚类的基准词的选择方法:从目标领域本体中选出一组初始种子词进行扩展,聚类得出二代种子词,对二代种子词再进行扩展、聚类,依次迭代直至得到最优的聚类种子词,并作为最终选取的基准词。实验结果表明该方法提取的基准词在词的情感倾向分类中具有较高的准确率。 This paper put forward a method of selecting paradigm words, which was based on the existing randomness and sub- jectivity issue. Firstly, it expanded words by a group of selected initial seed words;secondly, it obtained the second generation of seed words by means of hierarchical clustering. According to the similarity between two different expanded words, then it ex- panded and clustered the second generation seed words. At last it orderly iterated by same procedure to get the optimal cluste- ring seed words as the final selected paradigm words. The experiment result indicates that the new method has a higher accuracy in selecting paradigm words while classifying the different emotional proclivities.

作者彭学仕孙春华

机构地区合肥工业大学管理学院电子商务研究所

出处《计算机应用研究》 CSCD 北大核心 2011年第1期114-116,共3页 Application Research of Computers

基金高等院校博士点基金资助项目(20090111110016) 合肥工业大学科学研究发展基金资助项目(2010HGXJ0009)

关键词基准词词汇情感倾向词的相似度词的聚类领域本体 paradigm word word sentiment orientation word similarity word clustering domain ontology

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1TOURNEY P D,LITTMAN M L.Measuring praise and criticism:inference of semantic orientation from association[J].ACM Trans on Information Systems,2003,21(4):315-346.
2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
3王素格,李德玉,魏英杰,宋晓雷.基于同义词的词汇情感倾向判别方法[J].中文信息学报,2009,23(5):68-74. 被引量：36
4何燕,穗志方,段慧明,李素建.基于专业术语词典的自动领域本体构造[J].情报学报,2007,26(1):65-70. 被引量：13
5马静,宋晴晴,刘思峰.基于OWL的领域本体的综合构建与进化[J].情报学报,2007,26(6):827-832. 被引量：11
6陈浪舟,黄泰翼.一种新颖的词聚类算法和可变长统计语言模型[J].计算机学报,1999,22(9):942-948. 被引量：17
7闻扬,苑春法,黄昌宁.基于搭配对的汉语形容词-名词聚类[J].中文信息学报,2000,14(6):45-50. 被引量：11
8胡和平,曾庆锐,路松峰.中文词聚类研究[J].计算机工程与科学,2006,28(1):122-124. 被引量：9
9孙茂松,左正平,邹嘉彦.基于k-近似的汉语词类自动判定[J].计算机学报,2000,23(2):166-170. 被引量：9

二级参考文献72

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2曹泽文,钱杰,张维明,邓苏.一种改进的本体映射方法[J].科学技术与工程,2006,6(19):3078-3082. 被引量：11
3徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：123
4许伟.句法-语义一体化的汉语句法分析研究[硕士学位论文].北京:清华大学,1997..
5边肇祺.模式识别[M].北京:清华大学出版社,1997..
6王根,赵军.中文褒贬义词语倾向性的分析[C].第三届学生计算语言学研讨会论集,2006:81-85.
7PETER D.Turney.Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews[C]//Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL)//Philadelphia,PA,USA.2002; 417-424.
8PETER D.Turney and MICHAEL L.Littman.Measuring praise and criticism:inference of semantic orientation from association[J].ACM Transactions on Information Systems,2003,21(4):315-346.
9PETER D.Turney and MICHAEL L.Littman.Unsupervised learning of semantic orientation from a hundred-billion-word corpus[R].Tech.Rep.EGB-1094,National Research Council Canada:2002.
10DAVE K.,LAWRENCE S.,and PENNOCK D..Mining the peanut gallery.,opinion extraction and semantic classification of product reviews[C]//Proceedings of the 22nd International World Wide Web Conference.Budapest,Hungary:2003.

共引文献392

1杜家驹,岂凡超,孙茂松,刘知远.基于局部语义相关性的定义文本义原预测[J].中文信息学报,2020(5):1-9. 被引量：4
2吴光远,何丕廉,曹桂宏,聂颂.基于向量空间模型的词共现研究及其在文本分类中的应用[J].计算机应用,2003,23(z1):138-140. 被引量：23
3杨频,李涛,赵奎.一种网络舆情的定量分析方法[J].计算机应用研究,2009,26(3):1066-1068. 被引量：19
4申晓晔,封化民,毋非.基于语义的Web新闻内容倾向性分析框架[J].郑州大学学报（理学版）,2009,41(1):33-35.
5陈史政,章权兵.关于词聚类中二元词聚类的一些探讨[J].福建广播电视大学学报,2007(6):76-78.
6罗安,王勇,张福浩,刘纪平.基于角色标注的中文POI名称语义分类方法[J].测绘通报,2012(S1):521-524. 被引量：3
7李国林,万常选,边海容,杨莉,钟敏娟.基于语素的金融证劵域文本情感探测[J].计算机研究与发展,2011,48(S3):54-59. 被引量：7
8郑小慎,何丕廉,陈治纲,任大同,吴克敏.基于凝聚点的文本动态聚类分析[J].微型机与应用,2004,23(8):58-60.
9张辉,薛贵荣.基于文本挖掘的搭配词典自动架构探讨[J].上海工程技术大学学报,2004,18(4):323-326. 被引量：2
10胡和平,曾庆锐,路松峰.中文词聚类研究[J].计算机工程与科学,2006,28(1):122-124. 被引量：9

同被引文献56

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2路斌,万小军,杨建武,等.基于同义词词林的词汇褒贬计算[C]//中国计算技术与语言问题研究-第七届中文信息处理国际会议论文集.北京:电子工业出版社,2007:17-23.
3董振东,董强.知网[DB/OL].[2009-03-15].http://www.keenage.com.
4刘群,李素建.基于《知网》的词汇语义相似度的计算[C].台北:第三届汉语词汇语义学研讨会,2002.
5PETER D T. Thumbs up or thumbs down? Semantic orienta- tion applied to unsupervised classification of reviews[ C]//Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics. Philadelphia, USA, 2002: 417-424.
6Ku L W,Lo Y S,Chen H H.Using Polarity Scores of Words for Sentence-level Opinion Extraction [C]//Proceedings of the 6th NTCIR Workshop Meeting.Tokyo,Japan:[s.n.],2007:316-322.
7董振东,董强.知网[EB/ OL].(2011-06-23).http:// www.keenage.com.
8Kang J H,Lerman K,Plangprasopchok A.Analyzing Microblogs with Affinity Propagation[C]//Proceedings of the 1st KDD Workshop on Social Media Analytic.New York,USA:ACM Press,2010:67-70.
9Ramage D,Dumais S,Liebling D.Characterizing Microblogs with Topic Models [C]//Proceedings of International AAAI Conference on Weblogs and Social Media.Menlo Park,USA:AAAI Press,2010:130-137.
10Kaji N,Kitsuregawa M.Building Lexicon for Sentiment Analysis from Massive Collection of HTML Documents[C]// Proceedings of EMNLP-CoNLL 2007.Prague,Czech:[s.n.],2007:1075-1083.

引证文献7

1张清亮,徐健.网络情感词自动识别方法研究[J].现代图书情报技术,2011(10):24-28. 被引量：12
2程传鹏,王海龙.情感倾向判断中基准词的选择[J].智能系统学报,2013,8(4):349-355. 被引量：5
3黄高峰,周学广,李娟,刘华.具有权重因子的细粒度情感词库构建方法[J].计算机工程,2014,40(11):211-214. 被引量：4
4朱波,侯敏.基于边界特征的情感新词提取方法[J].重庆邮电大学学报（自然科学版）,2014,26(6):796-802.
5徐勇.基于价值累加理论的网络热点事件舆情研判及系统实现[J].计算机工程与科学,2015,37(12):2256-2261. 被引量：3
6方溢君,何炎祥,刘楠.一种基于图的情感基准词选择方法[J].数据采集与处理,2017,32(4):844-852.
7史伟.基于极性等级法的观点词词典自动扩展研究[J].情报理论与实践,2019,42(10):157-161.

二级引证文献23

1徐健.基于网络用户情感分析的预测方法研究[J].中国图书馆学报,2013,39(3):96-107. 被引量：32
2李光敏,张磊,赵登科.产品意见挖掘研究进展[J].现代情报,2014,34(3):32-35.
3杜嘉忠,徐健,刘颖.网络商品评论的特征–情感词本体构建与情感分析方法研究[J].现代图书情报技术,2014(5):74-82. 被引量：35
4齐富民,谢晓尧,景凤宣.SVM词库智能更新技术在搜索分类中的应用[J].计算机工程与设计,2014,35(6):2017-2023. 被引量：1
5黄高峰,周学广,李娟,刘华.具有权重因子的细粒度情感词库构建方法[J].计算机工程,2014,40(11):211-214. 被引量：4
6李海生.一种热点话题算法在微博舆情系统中的应用[J].现代电子技术,2015,38(6):44-46. 被引量：2
7徐勇.网络舆情事件演变的动力学建模及预警监测[J].现代情报,2016,36(4):14-19. 被引量：13
8王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,42(4):495-511. 被引量：72
9赵丹华.产品造型情感类型与情感价值的研究框架[J].包装工程,2016,37(20):1-8. 被引量：17
10周红照,侯敏,滕永林.评价知识本体研究与规则实现[J].现代图书情报技术,2016(10):25-32. 被引量：7

1陈岳峰,苗夺谦,李文,张志飞.基于概念的词汇情感倾向识别方法[J].智能系统学报,2011,6(6):489-494. 被引量：10
2王素格,李德玉,魏英杰,宋晓雷.基于同义词的词汇情感倾向判别方法[J].中文信息学报,2009,23(5):68-74. 被引量：36
3宋晓雷,王素格,李红霞,李德玉.基于概率潜在语义分析的词汇情感倾向判别[J].中文信息学报,2011,25(2):89-93. 被引量：15
4冷泳林,张清辰,赵亮,鲁富宇.基于离群点检测的K-means算法[J].渤海大学学报（自然科学版）,2014,35(1):34-38. 被引量：3
5王铁套,王国营,陈越,黄惠新.基于语义模式与词汇情感倾向的舆情态势研究[J].计算机工程与设计,2012,33(1):74-77. 被引量：14
6耿晴.基于SSPG的空间聚类初始种子选择方法[J].地理空间信息,2008,6(4):58-61. 被引量：1
7秦胜君,卢志平.基于限制玻尔兹曼机的无极性标注情感分类研究[J].科学技术与工程,2013,21(35):10703-10707. 被引量：2
8邱波.基于改进区域生长的巡检机器人道路实时检测方法[J].科技信息,2009(2):182-183.
9石亚冰,黄予,覃晓,元昌安.基于优化初始种子新策略的K-Means聚类算法[J].广西师范大学学报（自然科学版）,2013,31(4):33-40. 被引量：2
10邹宁,李庆,柳健.基于Kohonen神经网络的深度图像分割方法[J].红外与激光工程,2000,29(1):22-24.

计算机应用研究

2011年第1期

浏览历史

内容加载中请稍等...

面向倾向性分析的基于词聚类的基准词选择方法被引量：7

参考文献9

二级参考文献72

共引文献392

同被引文献56

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

面向倾向性分析的基于词聚类的基准词选择方法 被引量：7

参考文献9

二级参考文献72

共引文献392

同被引文献56

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

面向倾向性分析的基于词聚类的基准词选择方法被引量：7