基于依存关系的句法分析统计模型被引量：13

Statistical language paring model based on dependency

下载PDF

导出

摘要利用语义、语法等语言知识,建立一种基于依存关系的句法分析统计模型,并利用改进的句法分析模型进行句法分析实验。研究结果表明:利用依存关系、互信息对词聚类,能解决模型数据稀疏问题;模型可同时考虑几种语义依存关系;该模型是一个词汇化的句法分析模型,能结合分词、词性标注进行句法分析;概率上下文无关语法中由概率的上下文无关性假设和祖先结点无关性假设引起的问题在该模型中得到有效解决;精确率和召回率分别为86.96%和85.25%,其综合指标F与Collins的头驱动句法分析模型的F相比提高4.75%。 By incorporating linguistic features such as semantic dependency and syntactic relations, a novel statistical Parsing model was proposed. The experiments were conducted for the refined statistical parser. The results show that the model is constructed on word cluster, so the problem of data sparseness is not serious. The model can take advantage of a few semantic dependencies at the same time. The model is a parser based on lexicalized model, it is combined with segmentation and POS tagging model and thus a language parser is built. The questions caused by context-free hypothesis and ancestor-free hypothesis in probability context free grammar are solved well in this model. It achieves 86.96% precision and recall 85.25%, F value is improved by 4.75% compared with that of the head-driven parsing model introduced by Collins.

作者袁里驰

机构地区江西财经大学信息学院数据与知识工程江西省重点实验室中南大学信息科学与工程学院

出处《中南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2009年第6期1630-1635,共6页 Journal of Central South University:Science and Technology

基金国家自然科学基金资助项目(60763001 60663007) 中南大学博士后科学基金资助项目(2007年)

关键词自然语言处理词聚类中心词驱动句法分析统计模型 natural language processing word clustering head-driven parsing model statistical parsing model

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1Manning C D, Schutze H. Foundations of statistical natural language processing[M]. London: The MIT Press, 1999.
2钟义信.关于“信息-知识-智能转换规律”的研究[J].电子学报,2004,32(4):601-605. 被引量：27
3Chelba C, Jelinek F. Structured language modeling[J]. Computer Speech and Language, 2000, 14(4): 283-332.
4XUE Nian-wen, XIA Fei, CHIOU Fu-dong, et al. The Penn Chinese treebank: Phrase structure annotation of a large corpus[J]. Natural Language Engineering, 2005, 11(2): 207-208.
5Fung P, Ngai G, YANG Yong-sheng, et al. A maximum-entropy Chinese parser augmented by transformation-based learning[J]. ACM Trans on Asian Language Processing, 2004, 3(2): 159-168.
6Goodman J T. A bit of progress in language modeling[J]. Computer Speech and Language, 2001, 10: 403-434.
7赵军,黄昌宁.汉语基本名词短语结构分析模型[J].计算机学报,1999,22(2):141-146. 被引量：28
8孟遥,李生,赵铁军,曹海龙.四种基本统计句法分析模型在汉语句法分析中的性能比较[J].中文信息学报,2003,17(3):1-8. 被引量：10
9杨开城.一种基于句法语义特征的汉语句法分析器[J].中文信息学报,2000,14(3):46-53. 被引量：7
10Collins M. Head-driven statistical models for natural language parsing[D]. Pennsylvania: The University of Pennsylvania, 1999.

二级参考文献33

1钟义信.知识论框架通向信息-知识-智能统一的理论[J].中国工程科学,2000,2(9):50-64. 被引量：34
2颜龙,刘刚,郭军.基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究[J].中文信息学报,2006,20(2):60-65. 被引量：6
3唐赟,刘文举,徐波.基于后验概率解码段模型的汉语语音数字串识别[J].计算机学报,2006,29(4):635-641. 被引量：12
4刘宇红,刘桥,任强.基于模糊聚类神经网络的语音识别方法[J].计算机学报,2006,29(10):1894-1900. 被引量：14
5张辉,杜利民.汉语连续语音识别中不同基元声学模型的复合[J].电子与信息学报,2006,28(11):2045-2049. 被引量：7
6严斌峰,朱小燕,张智江,张范.基于邻接空间的鲁棒语音识别方法[J].软件学报,2007,18(4):878-883. 被引量：5
7杨沐昀赵铁军于浩.自底向上的汉语句法标注体系设计与实践[A].黄昌宁主编.自然语言理解与机器翻译[C].南京清华大学出版社,2001.160—166.
8Rabiner L, Juang B H. Fundamentals of speech recognition[M]. New Jersey: Prentice Hall, 1993.
9Chang E, ZHOU Jian-lai, SHOU Di, et al. Large vocabulary mandarin speech recognition with different approaches in modeling tones[C]//Proceedings of the 6th International Conference on Spoken Language Processing(ICSLP 2000). San Jose: IEEE Press, 2000: 983-986.
10Mitchell C D, Jamieson L H. Modeling duration in a hidden Markov model with the exponential family[C]//Proceedings of the IEEE International conference on Acoustic, Speech, Signal Process (ICASSP 1993). San Jose: IEEE Press, 1993: 331-334.

共引文献82

1刘云,俞士汶.“句管控”与中文信息处理[J].汉语学报,2004(2):56-62. 被引量：5
2张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
3周钦强,孙炳达,王义.文本自动分类系统文本预处理方法的研究[J].计算机应用研究,2005,22(2):85-86. 被引量：15
4尹一瓴,陈群秀.现代汉语语义知识库用于句法分析的研究[J].计算机应用,2004,24(B12):264-267. 被引量：1
5陈晓辉,周源远,袁春风,武港山.一种有效的汉语概率句法分析算法[J].计算机应用研究,2006,23(1):141-143. 被引量：2
6林颖,史晓东,郭锋.一种基于概率上下文无关文法的汉语句法分析[J].中文信息学报,2006,20(2):1-7. 被引量：11
7葛哲学,杨拥民,胡政,王兴伟,温熙森.基于知识的直升机自动驾驶仪故障融合诊断策略[J].中国机械工程,2006,17(4):338-342. 被引量：7
8刘锦源.知识方程与情报决策[J].情报杂志,2006,25(5):105-108. 被引量：4
9唐彰国,孙威力,邵发明.人工智能研究进展[J].乐山师范学院学报,2006,21(5):39-41.
10窦永香,赵捧未.关于知识管理实施理论的思考[J].图书情报工作,2007,51(2):38-40. 被引量：2

同被引文献183

1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
2沈家煊.句式和配价[J].中国语文,2000(4):291-297. 被引量：221
3李珀瀚,何震瀛,向河林.一种基于链接聚类的查询扩展算法[J].计算机研究与发展,2011,48(S3):197-204. 被引量：2
4耿德芳.英汉句法结构的语用对比分析[J].疯狂英语（教师版）,2007,0(3):39-41. 被引量：2
5刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
6Gai-TaiHuang,Hsiu-HsenYao.Chinese Question-Answering System[J].Journal of Computer Science & Technology,2004,19(4):479-488. 被引量：2
7邓文彬.最近20年来汉语句法分析方法研究述略[J].西南民族大学学报（人文社会科学版）,2004,25(6):342-348. 被引量：2
8林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：48
9张宇,刘挺,文勖.基于改进贝叶斯模型的问题分类[J].中文信息学报,2005,19(2):100-105. 被引量：47
10周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量：25

引证文献13

1李雯雯.基于依存树库的英汉语主语句法计量特征的对比研究[J].语言研究集刊,2020(1):173-191. 被引量：1
2黄莉.浅析汉语语言处理中的句法分析方法[J].价值工程,2010,29(17):162-163.
3袁里驰.基于配价结构的词汇化句法分析模型[J].中南大学学报（自然科学版）,2012,43(5):1808-1813. 被引量：2
4袁里驰.融合语言知识的统计句法分析[J].中南大学学报（自然科学版）,2012,43(3):986-991. 被引量：5
5张达夫.基于依存关系匹配的长难查询处理[J].电脑知识与技术,2012,8(7):4720-4724.
6苏朋程.管理复杂性分析[J].商业时代,2012(36):70-72. 被引量：2
7李丽,赵文娟,樊孝忠.基于词间依存的汉语基本块依存关系识别[J].计算机科学,2013,40(11A):259-262.
8吴家皋,周凡坤,张雪英.HMM模型和句法分析相结合的事件属性信息抽取[J].南京师大学报（自然科学版）,2014,37(1):30-34. 被引量：10
9袁里驰.基于统计的句法分析方法[J].中南大学学报（自然科学版）,2014,45(8):2669-2675. 被引量：6
10张宁,朱礼军.中文问答系统问句分析研究综述[J].情报工程,2016,2(1):32-42. 被引量：13

二级引证文献45

1袁里驰.基于配价结构和语义依存关系的句法分析统计模型[J].电子学报,2013,41(10):2029-2034. 被引量：6
2裴韬,郭思慧,袁烨城,张雪英,袁文,高昂,赵志远,薛存金.面向公共安全事件的网络文本大数据结构化研究[J].地球信息科学学报,2019,21(1):2-13. 被引量：16
3马建军,宗敏.功能小句自动句法分析结果的错误分析[J].鸡西大学学报（综合版）,2014,14(9):124-127.
4余丽,陆锋,张恒才.网络文本蕴涵地理信息抽取:研究进展与展望[J].地球信息科学学报,2015,17(2):127-134. 被引量：41
5郑丽芳,唐朝辉.潜在语义分析的英汉口译语料库挖掘[J].厦门理工学院学报,2015,23(1):86-90. 被引量：1
6于彤,朱玲,李敬华,高宏杰.中医文本信息抽取系统[J].中国医学创新,2015,12(21):108-110. 被引量：2
7尚文清,古丽拉.阿东别克,牛娜,于智娟.基于PChart算法的哈萨克语句法分析[J].计算机工程与设计,2016,37(3):832-836. 被引量：4
8朱玲,于彤,杨峰.基于关键动词的中医古籍概念实体间语义关系发现研究[J].中国数字医学,2016,11(5):73-75. 被引量：8
9袁里驰.几种基于统计的词聚类方法比较[J].中南大学学报（自然科学版）,2016,47(9):3079-3084. 被引量：1
10袁里驰.融合语义类信息的句法分析统计模型[J].数据采集与处理,2017,32(1):175-181. 被引量：1

1袁里驰.融合语言知识的统计句法分析[J].中南大学学报（自然科学版）,2012,43(3):986-991. 被引量：5
2袁里驰.基于配价结构和语义依存关系的句法分析统计模型[J].电子学报,2013,41(10):2029-2034. 被引量：6
3袁里驰.基于词聚类的依存句法分析[J].中南大学学报（自然科学版）,2011,42(7):2023-2027. 被引量：10
4袁里驰.基于配价结构的词汇化句法分析模型[J].中南大学学报（自然科学版）,2012,43(5):1808-1813. 被引量：2
5袁里驰.中心词驱动句法分析中的平滑技术[J].电子学报,2013,41(7):1337-1342. 被引量：1
6袁里驰.融合语义类信息的句法分析统计模型[J].数据采集与处理,2017,32(1):175-181. 被引量：1
7袁里驰.基于统计的句法分析方法[J].中南大学学报（自然科学版）,2014,45(8):2669-2675. 被引量：6
8何亮,戴新宇,周俊生,陈家骏.中心词驱动的汉语统计句法分析模型的改进[J].中文信息学报,2008,22(4):3-9. 被引量：3
9马彬,洪宇,杨雪蓉,姚建民,朱巧明.基于语义依存线索的事件关系识别方法研究[J].北京大学学报（自然科学版）,2013,49(1):109-116. 被引量：15
10林旭东,彭宏,郑启伦,陈绍坚.基于Web的中文开放式问题回答系统[J].计算机科学,2006,33(5):211-213.

中南大学学报（自然科学版）

2009年第6期

浏览历史

内容加载中请稍等...

基于依存关系的句法分析统计模型被引量：13

参考文献14

二级参考文献33

共引文献82

同被引文献183

引证文献13

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

基于依存关系的句法分析统计模型 被引量：13

参考文献14

二级参考文献33

共引文献82

同被引文献183

引证文献13

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

基于依存关系的句法分析统计模型被引量：13