-
题名一种适用于移动搜索的中文分词算法
被引量:2
- 1
-
-
作者
贺菲菲
贺炎
齐静娜
-
机构
中兴通讯股份有限公司西安研发中心
西安邮电大学计算机学院
-
出处
《西安邮电大学学报》
2015年第4期62-65,共4页
-
基金
国家自然科学基金资助项目(61373116)
西安邮电大学青年基金资助项目(ZL2014-27)
-
文摘
针对现有中文分词算法无法为移动搜索提供用户兴趣偏好信息的现状,提出一种改进的正向最大匹配中文分词算法。该算法基于逐字二分的分词词典机制,添加词分类信息,在词典中存储了每个词条的分类信息,分词时采用改进的次字区位码哈希非均匀分段机制进行正向最大匹配分词。实验结果表明,与逐字二分法相比,改进的分词算法其存储空间增加了13%,但时间效率提高了20%左右,且分词后可同时提取出词条的分类信息。
-
关键词
中文分词
词典机制
词分类信息
-
Keywords
chinese word segmentation, dictionary mechanism, words' classified information
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-