期刊文献+

统计和规则相结合的汉语组块分析 被引量:21

CHINESE CHUNKING PARSING USING RULE-BASED AND STATISTICS-BASED METHODS
下载PDF
导出
摘要 从文本中获得的组块对机器翻译、信息检索等很多领域都非常有用.介绍了规则和统计进行组块分析的处理策略,提出了规则与统计相结合的处理方法.并且结合组块分析的实际情况改进了一般评价系统性能的指标,通过封闭测试和开放测试验证,与单纯规则组块划分相比较,组块识别的精确率和召回率都得到了提高,组块划分错误率降低了7%. To acquire chunks from running texts is useful for many applications, such as machine translation, information retrieving, etc.. Described in this paper are the schemes of rule-based chunker and statistics-based chunker. Also proposed is a method to combine rule-based processing with statistics-based processing. According to the practical situation the mistake recall is introduced to rate the performance of the system. Compared with the rule-based system, the precision and recall are enhanced to identify chunks, and the error rate is reduced about 7%. The performance of the whole system has been improved greatly.
出处 《计算机研究与发展》 EI CSCD 北大核心 2002年第4期385-391,共7页 Journal of Computer Research and Development
基金 国家"九七三"重点基础研究项目基金资助(G1998030507-4)
关键词 统计 规则 汉语组块分析 语料库 自然语言处理 计算机 chunk parsing, partial parsing, corpus
  • 相关文献

参考文献4

二级参考文献12

  • 1张卫国.三种定语、三类意义及三个槽位[J].中国人民大学学报,1996,(4):97-100.
  • 2俞士汶,1994年
  • 3周强,计算机研究与运用,1993年
  • 4白栓虎,1992年
  • 5刘开瑛,1992年
  • 6俞士汶,1991年
  • 7减怀德,形容词用法词典,1991年
  • 8孟琮,动词用法词典,1985年
  • 9朱德熙,语法答问,1985年
  • 10张卫国,中国人民大学学报,1996年,4期,97页

共引文献110

同被引文献283

引证文献21

二级引证文献109

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部