摘要
《资讯处理用中文分词规范》有下列两个突破:(1)提出分级的观念及确立信、达、雅三级的标准。最容易达到的信级订为基本资料交换的标准;技术上较难,但自动分词程式仍可达到的达级作自动翻译、资讯检索等自然语言处理的标准;至于最需要人工分词才能达到的雅级则视为电脑处理、理解中文之最高目标。(2)把分词规范分成不变核心(分词单位定义及基本原则),以及可变准则(辅助原则)。在确定分词规范架构后,只要定时更新基本词库或特殊领域的专门词库。
出处
《语言文字应用》
CSSCI
北大核心
1997年第1期94-102,共9页
Applied Linguistics