期刊文献+

基于SVM的组块识别及其错误驱动学习方法 被引量:6

Chunk Parsing Based on SVM and Error-Driven Learning Methods
下载PDF
导出
摘要 给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法。该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条件对候选集进行筛选,得到最终的校正规则集;最后应用该规则集对SVM的组块识别结果进行校正。实验结果表明,与单独采用SVM模型的组块识别相比,加入错误驱动学习方法后,组块识别的精确率、召回率和F值均得到了提高。 Chunk parsing of Chinese texts can decrease the difficulty of syntactic parsing. This paper proposes a chunking approach that combines support vector machine with error-driven learning. First, the SVM model is used to chunk the training data. Then by error-driven learning, we automatically acquire the tuning rules from the chunking results of SVM. After filtration the rules are used to revise the chunk parsing results of SVM. The experimental results show that this approach is effective in Chinese chunk parsing. Compared with the pure SVM-based chunking, the performance is improved.
出处 《中文信息学报》 CSCD 北大核心 2006年第6期17-24,共8页 Journal of Chinese Information Processing
基金 国家自然科学基金资助项目(60373095 60373096)
关键词 计算机应用 中文信息处理 组块分析 错误驱动学习 支持向量机(SVM) 规则集 computer application Chinese information processing chunk parsing error-driven learning support vector machine (SVM) rule set
  • 相关文献

参考文献19

二级参考文献110

  • 1孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量:38
  • 2周强.一个汉语短语自动界定模型[J].软件学报,1996,7(A00):315-322. 被引量:9
  • 3张卫国.三种定语、三类意义及三个槽位[J].中国人民大学学报,1996,(4):97-100.
  • 4周强.汉语语料库的短语自动划分和标注研究.北京大学博士研究生学位论文[M].-,1996..
  • 5赵军.汉语基本名词短语识别及结构分析研究.清华大学工学博士学位论文[M].-,1998..
  • 6孙宏林.现代汉语非受限文本的实语块分析.北京大学博士研究生学位论文[M].-,2001..
  • 7[1]Erik F, Tjong Kim Sang,Buchholz S. Introduction to the CoNLL-2000 Shared Task: Chunking. In: Proceedings of CoNLL2000 and LLL-2000, Lisbon, Portugal, 2000. 127~132
  • 8[2]Steven A. Parsing by Chunks. In: Berwick, Abney, Tenny eds. Principle-Based Parsing: Kluwer Academic Publishers,1991. 257~278
  • 9[5]Ratnaparkhi A. A maximum entropy model for part-of-speech tagging. In: Proceedings of the Conference on Empirical Methods in Natural Language Processing, 1996
  • 10[6]Ratnaparkhi A. A simple introduction to maximum entropy models for natural language processing. Institute for Research in Cognitive Science, University of Pennsylvania : Technical Report 9708, 1997

共引文献258

同被引文献71

引证文献6

二级引证文献49

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部