基于统计方法的蒙古语依存句法分析模型被引量：3

Mongolian Dependency Parsing Based on Statistical Methods

下载PDF

导出

摘要蒙古语文信息处理已初步完成字、词处理阶段的基本任务,正在步入句处理阶段,并且在国家自然科学基金的资助下构建了蒙古语依存树库MDTB。该文以MDTB为训练和评测数据,设计实现了一种基于词汇依存概率的蒙古语依存句法分析模型。目前,该模型的无标记准确率、有标记准确率和核心词准确率分别达到了71.24%、61.42%和93.05%。 Mongolian language information processing has completed the basic task of word processing stage,and now is entering the stage of sentence processing.Under the support of National Natural Science Foundation,we have constructed the Mongolian Dependency Treebank（MDTB）.In this paper,we use MDTB as training and evaluation data,designing and implementing a Mongolian dependency parsing model based on lexical dependent probability.Currently,the model achieves accuracies of 71.24%,61.42% and 93.05% in the unlabelled annotation score,the labeled annotation score and the head word annotation score,respectively.

作者斯.劳格劳华沙宝萨如拉

机构地区内蒙古大学蒙古学学院

出处《中文信息学报》 CSCD 北大核心 2012年第3期27-32,共6页 Journal of Chinese Information Processing

基金国家自然科学基金项目(60763003) 国家社科基金项目(10CYY022) 教育部人文社会科学研究项目(09yjc740045)

关键词蒙古文依存语法句法分析概率模型 Mongolian dependency grammar parsing probability model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1刘海涛.依存语法和机器翻译[J].语言文字应用,1997(3):91-95. 被引量：43
2Jan Hajic,Massimiliano Ciaramita,RichardJohansson,et al.The CoNLL-2009Shared Task onSyntactic and Semantic Dependencies in MultipleLanguages[C] //Proceedings of the ThirteenthConference on Computational Natural LanguageLearning(CoNLL-2009).Boulder,Colorado,USA,June 4,2009:1-18.
3Mihai Surdeanu,Richard Johansson,Adam Meyers,et al.The CoNLL-2008Shared Task on Joint Parsingof Syntactic and Semantic Dependencies[C] //Proceedings of the Twelfth Conference onComputational Natural Language Learning(CoNLL2008).Manchester,UK,August 16-17,2008:159-177.
4Joakim Nivre,Johan Hall,Sandra Kübler,et al.TheCoNLL-2007 Shared Task on Dependency Parsing[C] //Proceedings of the CoNLL Shared Task Sessionof EMNLP-CoNLL 2007.Prague,Czech Republic,June 28-30,2007:915-932.
5Eisner,J.M..Three new probabilistic models fordependency parsing:An exploration[C] //Proceedingsof ACL-1996.University of California,Santa Cruz,California,USA,June 24-27,1996:340-345.
6M.Collins,Three Generative.Lexicalized Models forStatistical Parsing[C] //Proceedings of the 35th annualmeeting of the association forcomputational linguistics,Madrid,Spain.July,1997:16-23.
7马金山.基于统计方法的汉语依存句法分析研究[D].哈尔滨:哈尔滨工业大学计算机科学与技术学院,2007.
8S.Loglo,HuaShabao,Sarula.Research on MongolianLexical Analyzer Based on NFA[C] //Proceedings of2010 IEEE International Conference on IntelligentComputing and Intelligent Systems(Volume 2),Xiamen,China,October 29-30,2010:240-245.

共引文献49

1刘海涛,林燕妮.大数据时代语言研究的方法和趋向[J].新疆师范大学学报（哲学社会科学版）,2018,39(1):72-83. 被引量：27
2刘彬.基于依存语法的消歧策略在机译中的运用[J].湖南医科大学学报（社会科学版）,2003,0(3):95-97.
3席素梅,高茜,徐鑫.浅谈基于改进贝叶斯模型的词义消歧方法[J].山东轻工业学院学报（自然科学版）,2006,20(3):49-51.
4刘玉屏.汉语语法学中的“动词中心说”考[J].绍兴文理学院学报（哲学社会科学版）,2006,26(5):83-87. 被引量：5
5刘彬,李丽.浅析基于依存语法的翻译软件词典的构建[J].湖南医科大学学报（社会科学版）,2005,7(2):129-131. 被引量：1
6马永军.基于依存语法的自然语言处理现状及前景展望[J].学术交流,2007(10):137-140. 被引量：4
7李良炎,何中市.句法标注的一般模型与参数分析[J].计算机科学,2007,34(11):189-192. 被引量：1
8原媛,彭建华,张汝云.基于统计的汉语词义消歧研究[J].信息工程大学学报,2007,8(4):501-504.
9杨思春,陈家骏.中文自动问答中句子相似度计算研究[J].情报学报,2008,27(1):35-41. 被引量：5
10刘彬,李丽.机译的消歧策略[J].中国科技翻译,2008,21(1):24-27.

同被引文献34

1黄永文,何中市.基于互信息的统计语言模型平滑技术[J].中文信息学报,2005,19(4):46-51. 被引量：8
2侯宏旭,刘群,那顺乌日图.基于实例的汉蒙机器翻译[J].中文信息学报,2007,21(4):65-72. 被引量：16
3舍那木吉拉.语文政策与语言发展变化之间的关系[J].中国蒙古学（蒙文）,2007,35(2):1-6. 被引量：1
4K Visweswariah,J Navratil,J Sorensen,et al.Syntax based reordering with automatically derived rules for improved statistical machine translation[C]//Proceeding of COLING,2010:1119-1127.
5M Khalilov,K Sima'an.Context-sensitive syntactic source-reordering by statistical transduction[C]//Proceeding of IJCNLP,2011:38-46.
6F Liang,L Chen,M Li,et al.A rule-based sourceside reordering on phrase structure subtrees[C]//Proceeding of IALP,2011:173-176.
7L Chen,M Li,M He,et al.Dependency parsing on source language with reordering information in SMT[C]//Proceeding of IALP,2012:133-136.
8N Yang,M Li,D Zhang,et al.A ranking based approach to word reordering for statistical machine translation[C]//Proceeding of ACL,2012:912-920.
9朱海,应玉龙,李文,等.第五届全国机器翻译研讨会中科院智能所评测技术报告[C]//第五届全国机器翻译研讨会论文集,2009.
10W Li,L Chen,Wudabala,M Li.A Chained Machine Translation Using Morphemes as Pivot Language[C]//Proceeding of COLING 2010 workshop:ALR,2010:169-177.

引证文献3

1陈雷,李淼,张健,曾伟辉.有限语料汉蒙统计机器翻译调序方法研究[J].中文信息学报,2013,27(5):198-204. 被引量：2
2卢凤.基于垂直搜索引擎的Lucene蒙文分词技术研究[J].内蒙古科技大学学报,2018,37(3):264-269.
3安娜尔,达胡白乙拉.蒙古语文语言政策文本树库的构建及其句法特征统计[J].现代语言学,2023,11(1):194-201.

二级引证文献2

1伊.达瓦,米尔阿迪力江.麦麦提.丝绸之路经济带相似语言信息横向处理通信技术的研究[J].新疆师范大学学报（自然科学版）,2014,33(4):66-74.
2王正丽,陈笑蓉.基于规则的彝汉双语调序模型研究[J].贵州大学学报（自然科学版）,2016,33(1):58-62. 被引量：1

1高松,冯志伟.基于依存树库的文本聚类研究[J].中文信息学报,2011,25(3):59-63. 被引量：3
2李发杰,余正涛,郭剑毅,李英,周兰江.借助汉-越双语词对齐语料构建越南语依存树库[J].中文信息学报,2015,29(6):69-74.
3华沙宝.现代蒙古文自动校对系统——MHAHP[J].内蒙古大学学报（哲学社会科学版）,1997,29(4):49-53. 被引量：4
4松云,塔娜.蒙古语文教材语料库系统建设研究[J].内蒙古师范大学学报（哲学社会科学版）,2016,45(4):66-69.
5刘挺,马金山,李生.基于词汇支配度的汉语依存分析模型[J].软件学报,2006,17(9):1876-1883. 被引量：24
6史林林,邱立坤,亢世勇.基于规则的依存树库错误自动检测与分析[J].北京大学学报（自然科学版）,2016,52(1):58-64. 被引量：1
7王慧兰.汉语句类依存树库的构建研究[J].北京大学学报（自然科学版）,2013,49(1):25-30. 被引量：3
8王慧兰,张克亮.面向机器翻译的句类依存树库构建及应用[J].中文信息学报,2015,29(1):75-81. 被引量：4
9呼日乐吐什,德.萨日娜,额尔敦朝鲁.蒙古文网络资源检索难点分析[J].呼伦贝尔学院学报,2016,24(2):9-13.
10邱立坤,史林林,王厚峰.多领域中文依存树库构建与影响统计句法分析因素之分析[J].中文信息学报,2015,29(5):69-75. 被引量：7

中文信息学报

2012年第3期

浏览历史

内容加载中请稍等...

基于统计方法的蒙古语依存句法分析模型被引量：3

参考文献8

共引文献49

同被引文献34

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于统计方法的蒙古语依存句法分析模型 被引量：3

参考文献8

共引文献49

同被引文献34

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于统计方法的蒙古语依存句法分析模型被引量：3