摘要
该文对中亚地区属于同一个语族的土耳其语、哈萨克语等诸语言的自然语言处理现状进行了综述。首先分别回顾土耳其语、哈萨克语和其他中亚语言在词法分析、句法分析、命名实体识别、机器翻译方面的研究进展,随后讨论了与具体语言无关的黏着语词法分析方面的研究情况,最后指出国内外中亚诸语言处理自然语言领域中所面临的问题和挑战,并对未来的研究提出了建议。
This paper reviews the progresses of natural language processing of Turkish,Kazakh and so on,which belong to the same language family in Central Asia.First,morphological analysis,syntax analysis,named entity recognition and machine translation are reviewed.Then the language independent methods for agglutinative language morphological analysis are discussed.Finally,problems and challenges of Central Asian language processing at home and abroad is summarized,and future studies are suggested.
作者
吐尔根.依布拉音
卡哈尔江.阿比的热西提
艾山.吾买尔
买合木提.买买提
Tuergun Ibrahim;Kahaerjiang Abiderexiti;Aishan Wumaier;Maihemuti Maimaiti(School of Information Science and Engineering,Xinjiang University,Urumqi,Xinjiang 830046,China;Xinjiang Laboratory of Multi-Language Information Technology,Urumqi,Xinjiang 830046,China)
出处
《中文信息学报》
CSCD
北大核心
2018年第5期1-13,21,共14页
Journal of Chinese Information Processing
基金
国家自然科学基金(61462083
61762084
61331011
61463048)
国家973计划(2014cb340506)
关键词
土耳其语
哈萨克语
黏着语
形态复杂语
Turkish
Kazakh
agglutinative language
morphological complex languages