期刊文献+

基于《知网》的中文信息结构抽取研究 被引量:4

An Approach Based HowNet for Extracting Chinese Message Structure
下载PDF
导出
摘要 文章提出了一种在真实文本中抽取中文信息结构的方法—利用大规模基于语义依存关系的语料库对《知网》的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语。该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景。 An approach of extracting Chinese Message Structure from real texts is presented in this paper.The authors used the annotated corpus based on semantic dependent relations for Chinese Message Structure patterns' training.With those patterns as rules,they built a partial dependency parser,so as to extract CMS from real texts as most as possible.The description of the training algorithm,experimental results and some conclusion are given.
出处 《计算机工程与应用》 CSCD 北大核心 2002年第18期56-58,共3页 Computer Engineering and Applications
基金 国家863高技术研究发展计划项目(编号:863-306-ZD03-02-1) 985重大项目"人机自然语言交互技术"(编号:985校-22-攻关-06)资助
关键词 《知网》 中文信息结构 部分依存分析器 中文信息处理 信息抽取 HowNet,Chinese Message Structure(CMS ),partial dependency parser,rule
  • 相关文献

参考文献2

  • 1李涓子.基于语义依存关系的汉语理解语言模型研究:博士后出站报告[M].北京:清华大学电子工程系,2001..
  • 2张建平.大词汇量连续语音识别中的语言模型和理解算法的研究:博士学位论文[M].北京:清华大学电子工程系,1999..

同被引文献24

  • 1刘亚军,徐易.一种基于加权语义相似度模型的自动问答系统[J].东南大学学报(自然科学版),2004,34(5):609-612. 被引量:36
  • 2张亮,冯冲,陈肇雄,黄河燕.基于语句相似度计算的FAQ自动回复系统设计与实现[J].小型微型计算机系统,2006,27(4):720-723. 被引量:19
  • 3董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量:99
  • 4董振东 董强.关于知网-中文信息结构库[EB/OL].http://www.keenage.com,.
  • 5The LTAG Research Group. A Lexical Tree Adjoining Grammar for English. Institute for Research in Cognitive Science, Univ. of Pennsylvania, 1998.
  • 6董振东.关于《知网》的动态角色与属性[R]:内部报告[R].,2001..
  • 7Xia Fei, Palmer M, Vijay-Shanker K, et al. Consistent Grammar Development Using Partial-tree Descriptions for Lexicalized Tree Adjoining Grammars. In Fourth International Workshop on Tree Adjoining Grammars and Related Frameworks. 1998:180-183.
  • 8Xue Nianwen, Xia Fei. The Bracketing Guidelines for the Penn Chinese Treebank. Technical Report IRCS 00-08, University of Pennsylvania,Philadelphia, PA, 2000.
  • 9中国互联网信息中心.第14次中国互联网络发展状况调查统计报告[R].http://www.cnnic.net.cn/ download/2004/2004072002.pdf,2004-07.
  • 10中国互联网信息中心.2003年中国互联网络信息资源数量调查报告[R].http://www.cnnic.net.cn/ download/ manual/report20030330.doc:60.

引证文献4

二级引证文献25

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部