期刊文献+

基于最大熵的中文组织机构名识别模型 被引量:2

Chinese Organizations' Names Recognition Model Based on the Maximum Entropy
下载PDF
导出
摘要 中文组织机构名识别的精确率一直是影响自然语言处理的因素之一.根据中文组织机构名的特点,提出采用最大熵的识别方法.实验系统在较大规模的数据集上对比了不同特征选择方法对模型的影响,同时考查了词面、词性、语法等信息对模型的贡献.实验结果表明,不同的特征选择算法,开放测试的平均值只相差0.2~0.5个百分点. The accurate identifying of Chinese organizations' names has been one of the factors which influences natural language processing.According to the specialty of Chinese organizations' name,the recognition method of the maximum entropy is put forward.With a large-scale set of data,we compare different results to the model caused by applying different feature selection.Besides,the contribution of word,part of speech,grammar etc is investigated.The experimental result suggests that,with different method of feature selection,the average of open test differs only by 0.2~0.5 percentage points.
出处 《计算机与数字工程》 2010年第12期36-40,共5页 Computer & Digital Engineering
  • 相关文献

参考文献4

二级参考文献46

  • 1张小衡.从“qinghuadaxue”谈起逐步实现中文智能输入[J].中文信息,1996,13(5):3-5. 被引量:1
  • 2清华大学计算机科学与技术系.汉语词性自动标注系统技术报告[R].,1992..
  • 3张茂松,中文信息学报,1995年,9卷,2期,16页
  • 4沈达阳,计算语言学进展与应用,1995年,68页
  • 5陈光磊,汉语词法论,1994年,27页
  • 6陆丙甫,核心推导语法,1993年
  • 7郑家恒,计算语言学进展与应用,1993年,139页
  • 8匿名著者,语言文字规范手册,1993年,293页
  • 9范晓,汉语的短语,1991年,48页
  • 10胡树鲜,现代汉语语法理论初探,1990年,282页

共引文献167

同被引文献19

引证文献2

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部