摘要
词聚类是一种面向词语的聚类技术,广泛应用于自然语言处理的各个方向。文章将部分已有的词聚类方法分为基于语法特征、基于语义特征和基于语用特征三类,并对各类方法进行了归纳整理。
Word clustering is a word-oriented clustering technique, which is widely applied in a number of NLP tasks. This survey paper provides a categorization of some of the existing word clustering methods.
出处
《数字图书馆论坛》
2010年第5期15-19,共5页
Digital Library Forum
基金
国家“十一五”科技支撑计划课题“知识组织系统的集成及服务体系研究与实现”(2006BAH03803)和“科技文献信息服务系统关键技术研究及应用示范”(2006BAH05806)资助项目.中国科学技术信息研究所重点工作项目“汉语科技词系统建设与应用工程--新能源汽车领域完善及领域扩展”(2009KP01-3-2)资金项目.
关键词
词聚类
语法特征
语义特征
语用特征
Word clustering, Grammatical feature, Semantic feature, Pragmatic feature