期刊文献+

书面藏语的续连规则及词形变体的自动识别 被引量:1

The Machine Identification of Affixing-rules in Writing Tibetan.
原文传递
导出
摘要 本文是现代书面藏语不同类型句法单位变体形式的机器自动识别研究,包括词形 变化的单位分类,抽取变体形式的信息和对文本进行句法语义功能的标注处理方法。 This paper discusses how to build up machine identification rules for differentiating the heterographs of Tibetan words and markers on the basis of affixing-rules database. The Tibetan affixing-rules database contains more than ten types of words, which change forms in texts according to the pre-syllabic ending forms. So the paper first describes the types of heterographic variants and their conditions, then advances a method to extract information of variants and goes on tagging and processing all the heterographs in the text.
作者 江荻
出处 《民族语文》 CSSCI 北大核心 2004年第6期50-54,共5页 Minority Languages of China
基金 国家自然科学基金资助(项目批准号为60173024)。
  • 相关文献

参考文献8

  • 1陈玉忠,李保利,俞士汶,兰措吉.基于格助词和接续特征的藏文自动分词方案[J].语言文字应用,2003(1):75-82. 被引量:49
  • 2江荻:《现代藏语的机器处理及发展之路》,载徐波、孙茂松、靳光瑾主编:《汉语自然语言处理若干重要问题》,科学出版社,2003年.--:《现代藏语组块分词的方法和过程》,《民族语文》2003年第4期.
  • 3图弥三菩札等著,黄明信编:《西藏文法四种合编》(藏文版),民族出版社,1956年.
  • 4张济川.藏语拉萨话声调分化的条件[J].民族语文,1981(3):14-18. 被引量:12
  • 5周季文、谢后芳:《藏文阅读入门》,云南民族出版社,1998年.
  • 6JiangDi, Kang Caijun (2003a). The Methods of Lemmatization of Bound Case forms in Modern Tibetan. IEEE International Conference on Natural Language Processing and Knowledge Engineering. IEEE Press.
  • 7Wylie, Turrell (1959). A standard system of Tibetan transcription. Harvard Journal of Asiatic Studies 22:263. 292.
  • 8何晓炜.Chomsky最简方案的新发展——《最简探索之框架》介绍[J].外语教学与研究,2000,32(2):147-151. 被引量:38

二级参考文献7

共引文献96

同被引文献13

引证文献1

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部