期刊文献+

汉语句子的组块分析体系 被引量:31

CHUNK PARSING SCHEME FOR CHINESE SENTENCES
下载PDF
导出
摘要 介绍了一种描述能力介于线性词序列和完整句法树表示之间的浅层句法知识描述体系——组块分析体系,并详细讨论了其中两大部分:词界块和成分组的基本内容及其自动识别算法.在此基础上,提出了一种分阶段构造汉语树库的新设想,即先构造组块库,再构造树库,进行了一系列句法分析和知识获取实验,包括1)自动识别汉语最长名词短语;2)自动获取汉语句法知识等.所有这些工作都证明了这种知识描述体系的实用性和有效性. This paper proposed the chunk parsing scheme , a shallow syntactic knowledge representation system with the descriptive ability between part of speech serial and parse tree representation, and discussed some basic concepts and automatic identification algorithms for its two main parts: word boundary stems and constituent groups. Based on this scheme, this paper also proposed a new treebank annotation strategy, i.e. from chunk bank to treebank, and carried out several syntactic parsing and knowledge acquisition experiments, such as 1) the automatic identification of Chinese maximal noun phrases, 2) the automatic acquisition of Chinese probabilistic context free grammar knowledge. All these work shows its usefulness and efficiency for natural language processing research and development.
出处 《计算机学报》 EI CSCD 北大核心 1999年第11期1158-1165,共8页 Chinese Journal of Computers
基金 国家自然科学基金 中国博士后科学基金
关键词 句法分析 自然语言处理 汉语句子 组块分析体系 Word boundary stem, constituent group, partial parsing, syntactic parsing.
  • 相关文献

参考文献10

  • 1周强,黄昌宁.汉语概率型上下文无关语法的自动推导[J].计算机学报,1998,21(5):385-392. 被引量:7
  • 2周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11. 被引量:35
  • 3周强,智能技术与系统国家重点实验室技术报告(TR98003),1998年
  • 4Zhou Qiang,Proc 5th Workshop on Very Large Corpora,1997年,4页
  • 5Zhou Qiang,Communications COLIPS,1997年,7卷,2期,53页
  • 6周强,中文信息学报,1997年,11卷,4期,1页
  • 7周强,软件学报,1996年,7卷,增刊,315页
  • 8周强,博士学位论文,1996年
  • 9Shih H H,Computer Speech Language,1995年,9卷,3期,235页
  • 10吴竞存,现代汉语句法结构与分析,1992年

二级参考文献15

  • 1周明,黄昌宁.面向语料库标注的汉语依存体系的探讨[J].中文信息学报,1994,8(3):35-52. 被引量:40
  • 2周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11. 被引量:35
  • 3周强,计算机研究与运用,1993年
  • 4李子云,汉语句法规则,1992年
  • 5房玉清,实用汉语语法,1992年
  • 6吴竞存,现代汉语句法结构与分析,1992年
  • 7范晓,汉语的短语,1991年
  • 8团体著者,世界汉语教学,1989年,1期
  • 9朱德熙,语法答问,1985年
  • 10周强,智能技术与系统国家重点实验室:技术报告TR-97001,1997年

共引文献39

同被引文献284

引证文献31

二级引证文献193

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部