从客户评论中识别命名实体——基于最大熵模型的实现被引量：2

Recognizing Named Entity from Free-text Customer Reviews——A Maximum Entropy Model-based Approach

导出

摘要介绍命名实体识别的基本概念,分析两种命名实体识别的基本方法:基于规则的命名实体识别方法和基于统计的命名实体识别方法,并以最大熵模型为理论基础,对中文菜名识别进行实证研究。根据中文命名实体的特点,设计6种特征模板。实验结果表明,在简单特征模板的基础上增加标注特征能有效提高命名实体的识别效果。对改进识别效果有用的特征依次为:标注特征、词性组合特征、后向词性依赖特征和词形特征。 This paper introduces the concept of Named Entity Recognition （ NER）, analyzes two basic approaches, the rulebased approach and the statistical approach, and conducts an empirical study on Chinese dish name recognition based on the theory of Maximum Entropy Model （MEM）. According to the characteristics of Chinese named entity, 6 fea- ture templates are designed. Experimental results show that adding tagging features to the basic simple feature template ean efficiently improve the performance of Named Entity Recognition. The features in order to improve recognition performance are as follow ： tagging features, combination of POS features, forward POS dependency features and word form features.

作者余传明黄建秋郭飞

机构地区中南财经政法大学信息与安全工程学院上海理工大学管理学院

出处《现代图书情报技术》 CSSCI 北大核心 2011年第5期77-82,共6页 New Technology of Library and Information Service

基金国家自然科学基金资助项目"Web2.0环境下基于本体学习的观点挖掘研究"(项目编号:70903047) 上海市重点学科建设项目"系统分析与集成"(项目编号:S30501)的研究成果之一

关键词命名实体识别最大熵模型客户评论文本挖掘 Named entity recognition Maximum entropy model User reviews Text mining

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1李楠,郑荣廷,吉久明,滕青青.基于启发式规则的中文化学物质命名识别研究[J].现代图书情报技术,2010(5):13-17. 被引量：12

二级参考文献11

1Grishman R, Sundhiem B. Design of the MUC -6 Evaluation[ C]. In : Proceedings of the 6th Message Understanding Conference. NJ : Association for Computational Linguistics, 1995 : 1 - 11.
2Chen H H, Ding Y W, Tsai S C, et al. Description of the NTU System Used for MET - 2 [ C ]. In : Proceedings of the 7th Message Understanding Conference. 1998.
3Black W J, Rinaldi F, Mowatt D. Facile: Description of the NE System Used For MUC - 7 [ C ]. In : Proceedings of the 7th Message Understanding Conference. 1998.
4Sun J, Gao J F, Zhang L, et al. Chinese Named Entity Identification Using Class Based Language Model [ C ]. In : Proceedings of the 19th International Conference on Computational Linguistics. N J: Association for Computational Linguistics, 2002 : 1 - 7.
5Zhou G D, Su J. Named Entity Recognition Using an HMM Based Chunk Tagger[ C ]. In: Proceedings of the 40th Annual Meeting of the ACL. NJ : Association for Computational Linguistics, 2002 : 473 - 480.
6Ramaparkhi A. A Simple Introduction to Maximum Entropy Models for Natural Language Processing [ R ]. Institute for Research in Cognitive Science, University of Pennsylvania, 1997.
7Krauthammer M, Rzhetsky A, Morozov P, et al. Using BLAST for Identifying Gene and Protein Names in Journal Articles [J]. Gene, 2000, 259( 1 ) :245 -252.
8Klinger R, Kolarik C, Fluck J, et al. Detection of IUPAC and IUPAC - like Chemical Names [ J ]. Bioinformatics, 2008, 24 ( 13 ) : 268 - 276.
9刘建华,张智雄,徐健,许雁冬.自动术语识别--对科技文献进行文本挖掘的重要技术方法[J].现代图书情报技术,2008(8):12-17. 被引量：12
10赵军.命名实体识别、排歧和跨语言关联[J].中文信息学报,2009,23(2):3-17. 被引量：50

共引文献11

1潘国巍,吉久明,李楠,郑荣廷.基于两类统计机器学习模型的中文化学物质名称识别研究[J].现代情报,2011,31(11):163-165. 被引量：3
2李楠,孙济庆,吉久明.汉语词素语义与知识发现研究初探[J].图书情报工作,2013,57(17):109-113. 被引量：3
3石崇德,乔晓东,王惠临,屈鹏.中文科技文献切分的领域适应技术研究[J].图书情报工作,2014,58(19):13-18.
4王倩倩,陈荣,李楠,孙济庆.面向化学名称的术语知识量计算模型研究[J].图书馆杂志,2015,34(10):59-62. 被引量：2
5刘艳超,郭剑毅,余正涛,周兰江,严馨,陈秀琴.融合实体特性识别越南语复杂命名实体的混合方法[J].智能系统学报,2016,11(4):503-512. 被引量：3
6马建红,王立芹,姚爽.面向化学资源文本的命名实体识别[J].郑州大学学报（理学版）,2018,50(4):14-20. 被引量：6
7焦凯楠,李欣,朱容辰.中文领域命名实体识别综述[J].计算机工程与应用,2021,57(16):1-15. 被引量：41
8郑洪浩,宋旭晖,于洪涛,李邵梅,郝一诺.基于深度学习的中文命名实体识别综述[J].信息工程大学学报,2021,22(5):590-596. 被引量：10
9孙瑜,史普润.基于子词的化学术语嵌入表示研究[J].信息技术与信息化,2022(7):50-57.
10贾杨春,朱定局.基于深度学习的医疗命名实体识别[J].计算机系统应用,2022,31(9):70-81. 被引量：3

同被引文献19

1姚天昉,聂青阳,李建超,李林琳,陈柯,付宁.一个用于汉语汽车评论的意见挖掘系统[C]//中文信息处理前沿进展-中国中文信息学会二十五周年学术会议论文集.北京:清华大学出版社,2006:260-281.
2Kim Soo-Min,Eduard Hovy.Determining the Sentiment of Opinions[C] //COLING'04Proceedings of the20th international conference on Computational Linguistics.Stroudsburg,PA,USA:Association for Computational Linguistics,2004.
3Hu Minqing,Liu Bing.Mining and summarizing customer reviews[C] //KDD'04Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining.New York,NY,USA:ACM,2004:168-177.
4赫博一,夏云庆,郑方.PINAX:一个有效的产品属性挖掘系统[C] //第四届全国信息检索与内容安全学术会议论文集.北京:清华大学智能技术与系统国家重点实验室,2008:281-290.
5Zhuang Li,Jing Feng,Zhu Xiao-Yan.Movie Review Mining and Summarization[C] //CIKM'06Proceedings of the15th ACM international conference on Information and knowledge management.New York,NY,USA:ACM,2006.
6吴月萍,陈玉泉.基于Web的概念属性抽取的研究[J].中国管理信息化,2009,12(10):98-101. 被引量：7
7余传明.从用户评论中挖掘产品属性——基于SOM的实现[J].现代图书情报技术,2009(5):61-66. 被引量：20
8余传明.从产品评论中挖掘观点:原理与算法分析[J].情报理论与实践,2009,32(7):124-128. 被引量：15
9宋晓雷,王素格,李红霞.面向特定领域的产品评价对象自动识别研究[J].中文信息学报,2010,24(1):89-93. 被引量：34
10闫丹辉,毕玉德.基于规则的越南语命名实体识别研究[J].中文信息学报,2014,28(5):198-205. 被引量：15

引证文献2

1董晓凯,莫苏宁,李博,陆伟.基于最大熵模型下复合特征模板的产品属性挖掘研究[J].苏州科技学院学报（自然科学版）,2012,29(1):61-65.
2杨晓燕,徐戈,谢安,庄泽彬.基于词典与条件随机场的中文菜名识别研究[J].信息与电脑,2018,30(17):91-93. 被引量：1

二级引证文献1

1朱亚军,拥措.基于深度学习的藏文人名地名识别[J].信息与电脑,2022,34(5):66-68.

1李实,叶强,李一军,罗嗣卿.挖掘中文网络客户评论的产品特征及情感倾向[J].计算机应用研究,2010,27(8):3016-3019. 被引量：69
2夏火松,陶敏,王一,魏翔.停用词表对基于SVM的中文文本情感分类的影响[J].情报学报,2011,30(4):347-352. 被引量：6
3石强强,赵应丁,杨红云.基于SVM的酒店客户评论情感分析[J].计算机与现代化,2017(3):117-121. 被引量：7
4周红庆,吴扬扬.中文客户评论对象特征的抽取与聚类方法[J].微型机与应用,2014,33(15):69-71. 被引量：4
5李实,叶强,李一军,RobLaw.中文网络客户评论的产品特征挖掘方法研究[J].管理科学学报,2009,12(2):142-152. 被引量：130
6吴丽华,冯建平,曹均阔.中文网络评论的IT产品特征挖掘及情感倾向分析[J].计算机与数字工程,2012,40(11):52-54. 被引量：8
7胡令传,陶晓鹏.客户评论中用户体验信息自动提取研究[J].计算机工程,2015,41(1):49-53. 被引量：2
8周红庆,吴扬扬.中文客户评论对象特征的抽取与聚类方法[J].微型机与应用,2014,33(17):72-75. 被引量：2
9涂顺林,刘利,李卫华,赵义霞.一种基于客户评论的产品特征提取方法[J].电脑知识与技术（过刊）,2016,22(5X):159-161.
10李实,陆光.修正中文评论挖掘中产品特征词序的实验研究[J].科学技术与工程,2012,20(21):5181-5186. 被引量：2

现代图书情报技术

2011年第5期

浏览历史

内容加载中请稍等...

从客户评论中识别命名实体——基于最大熵模型的实现被引量：2

参考文献1

二级参考文献11

共引文献11

同被引文献19

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

从客户评论中识别命名实体——基于最大熵模型的实现 被引量：2

参考文献1

二级参考文献11

共引文献11

同被引文献19

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

从客户评论中识别命名实体——基于最大熵模型的实现被引量：2