基于最大熵的中文组织机构名识别模型被引量：2

Chinese Organizations' Names Recognition Model Based on the Maximum Entropy

下载PDF

导出

摘要中文组织机构名识别的精确率一直是影响自然语言处理的因素之一.根据中文组织机构名的特点,提出采用最大熵的识别方法.实验系统在较大规模的数据集上对比了不同特征选择方法对模型的影响,同时考查了词面、词性、语法等信息对模型的贡献.实验结果表明,不同的特征选择算法,开放测试的平均值只相差0.2～0.5个百分点. The accurate identifying of Chinese organizations' names has been one of the factors which influences natural language processing.According to the specialty of Chinese organizations' name,the recognition method of the maximum entropy is put forward.With a large-scale set of data,we compare different results to the model caused by applying different feature selection.Besides,the contribution of word,part of speech,grammar etc is investigated.The experimental result suggests that,with different method of feature selection,the average of open test differs only by 0.2~0.5 percentage points.

作者冯丽萍焦莉娟

机构地区忻州师范学院计算机系

出处《计算机与数字工程》 2010年第12期36-40,共5页 Computer & Digital Engineering

关键词最大熵中文组织机构名识别模型 Chinese MAXIMUM ENTROPY Based 自然语言处理特征选择算法机构名识别选择方法实验系统实验结果识别方法数据集平均值精确率语法信息相差特点 maximum entropy,Chinese organizations' names,recognition,natural language processing

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献4

1李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
2林红,苑春法,郭树军.基于最大熵方法的汉语词性标注[J].计算机应用,2004,24(1):14-16. 被引量：8
3周雅倩,郭以昆,黄萱菁,吴立德.基于最大熵方法的中英文基本名词短语识别[J].计算机研究与发展,2003,40(3):440-446. 被引量：62
4张小衡,王玲玲.中文机构名称的识别与分析[J].中文信息学报,1997,11(4):21-32. 被引量：83

二级参考文献46

1张小衡.从“qinghuadaxue”谈起逐步实现中文智能输入[J].中文信息,1996,13(5):3-5. 被引量：1
2清华大学计算机科学与技术系.汉语词性自动标注系统技术报告[R].,1992..
3张茂松，中文信息学报，1995年，9卷，2期，16页
4沈达阳，计算语言学进展与应用，1995年，68页
5陈光磊，汉语词法论，1994年，27页
6陆丙甫，核心推导语法，1993年
7郑家恒，计算语言学进展与应用，1993年，139页
8匿名著者，语言文字规范手册，1993年，293页
9范晓，汉语的短语，1991年，48页
10胡树鲜，现代汉语语法理论初探，1990年，282页

共引文献167

1姚露露,李云岭,宋凯丽.中文地名地址标注方法研究[J].测绘地理信息,2021,46(S01):182-184. 被引量：1
2刘小可,王云兰.一个改进的基于最大熵原理的汉语词性标注系统[J].光盘技术,2007(6):17-18.
3王建新.我国在语料库语言学研究方面的部分进展(概述)[J].外语与外语教学,1999(3):18-20. 被引量：10
4陈小荷.自动分词中未登录词问题的一揽子解决方案[J].语言文字应用,1999(3):103-109. 被引量：26
5罗安,王勇,张福浩,刘纪平.基于角色标注的中文POI名称语义分类方法[J].测绘通报,2012(S1):521-524. 被引量：3
6李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
7孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
8陈晓明,周渝.汉语部分句法分析的研究和发展趋势[J].贵州大学学报（自然科学版）,2004,21(4):384-386. 被引量：2
9干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
10王建会,王雷,胡运发.词语间依存关系的定量识别[J].中文信息学报,2005,19(4):31-38. 被引量：3

同被引文献19

1邢云燕,武小悦.装备可靠性指标验证方法综述[J].战术导弹控制技术,2005,13(4):69-73. 被引量：4
2康文兴,谷小松,黄希利.自助最大熵法确定先验分布及其在导弹命中概率估计中的应用[J].装备指挥技术学院学报,2007,18(3):109-113. 被引量：5
3白璐.可靠性评估的一种Bayes方法[J].质量与可靠性,2007(3):20-23. 被引量：6
4王自力.可靠性数据分析[M].北京:国防工业出版社,2011:89-95.
5Sidall N. Probabilistic engineering design[M]. New York: Marcel Dekker, 1992 : 79-90.
6陈霄,刘慧,陈玉泉.基于支持向量机方法的中文组织机构名的识别[J].计算机应用研究,2008,25(2):362-364. 被引量：20
7程亮,童玲.最大熵原理在测量数据处理中的应用[J].电子测量与仪器学报,2009,23(1):47-51. 被引量：34
8周波,蔡东风.基于条件随机场的中文组织机构名识别研究[J].沈阳航空工业学院学报,2009,26(1):49-52. 被引量：8
9曾声奎,李霏霞,马纪明.基于响应面的系统性能可靠性优化设计方法[J].航空学报,2009,30(9):1655-1660. 被引量：5
10黄德根,李泽中,万如.基于SVM和CRF的双层模型中文机构名识别[J].大连理工大学学报,2010,50(5):782-787. 被引量：13

引证文献2

1王玉珏,杨继坤,徐廷学,刘潇.基于最大熵的武器系统可靠性建模与评估[J].舰船电子工程,2013,33(3):80-82. 被引量：2
2谢俊,严馨,王若兰,周枫,李思远.基于Tri-training的柬埔寨语组织机构名识别[J].软件导刊,2018,17(5):127-131. 被引量：1

二级引证文献3

1李超,王瑛,陈超,王强.基于QHSME的装备危险耦合传导GERT分析[J].系统工程与电子技术,2014,36(11):2219-2225. 被引量：6
2朱宇光,赵喜春,吕隽.导弹综控机最大熵可靠性检验方法研究[J].舰船电子工程,2016,36(5):124-125.
3何忠玻,严馨,徐广义,张金鹏,邓忠莹.基于Tri-training的社交媒体药物不良反应实体抽取[J].计算机工程与应用,2024,60(3):177-186.

1冯丽萍,焦莉娟.结合多特征的支持向量机中文组织机构名识别模型[J].现代计算机,2010,16(7):24-27. 被引量：2
2蔡月红,朱倩,程显毅.基于Tri-training半监督学习的中文组织机构名识别[J].计算机应用研究,2010,27(1):193-195. 被引量：4
3周波,蔡东风.基于条件随机场的中文组织机构名识别研究[J].沈阳航空工业学院学报,2009,26(1):49-52. 被引量：8

计算机与数字工程

2010年第12期

浏览历史

内容加载中请稍等...

基于最大熵的中文组织机构名识别模型被引量：2

参考文献4

二级参考文献46

共引文献167

同被引文献19

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于最大熵的中文组织机构名识别模型 被引量：2

参考文献4

二级参考文献46

共引文献167

同被引文献19

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于最大熵的中文组织机构名识别模型被引量：2