期刊文献+

基于字、词、词组的中文搜索引擎分词系统 被引量:3

A NEW WORD SEGMENTATION SYSTEM BASED ON CHARACTER, WORD,PHRASE MODEL FOR CHINESE SEARCH ENGINE
下载PDF
导出
摘要 分析了全文检索系统中常用的基于字表和基于词表的中文分词方法的优缺点 ,提出了基于字、词、词组混合模型的中文搜索引擎分词系统 ;并利用广义语词概念 ,设计了分词词典 ,改进了最大匹配分词算法 (MM) ;最后把分词系统应用于全文检索中。 The strongpoints and the shortcomings of the application of Character-based and Word-based Chinese word segmentation method is analyzed. A new Word Segmentation System Based on Character , Word and Phrase for Chinese Search Engine is proposed . A segmentation is designed by using the generalized concept of phraseology for the improvement of the MM arithmetic. Finally this new word segmentation system is applied in full-text search.
出处 《武汉工业学院学报》 CAS 2002年第3期37-40,共4页 Journal of Wuhan Polytechnic University
关键词 词组 中文 搜索引擎 分词系统 全文检索 最大匹配算法 广义语词 full-text search phraseology Segmentation Maximum Matching algorithm
  • 相关文献

参考文献6

二级参考文献42

  • 1周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11. 被引量:35
  • 2苏新宁.汉语词切分标引算法的改进[J].情报学报,1996,15(6):426-430. 被引量:9
  • 3张潮生,中文信息处理国际会议论文集,1987年
  • 4梁南元,中文信息,1986年,1期
  • 5姚天顺,计算机的汉字信息处理,1985年
  • 6管纪文,中文信息处理国际研讨论文集,1983年
  • 7冯志伟,中文信息处理与汉语研究,1992年
  • 8张国煊,计算机研究与发展,1991年,1期
  • 9黄祥熹,计算机应用与软件,1991年,6期
  • 10贺银云,计算机杂志,1991年,1期

共引文献108

同被引文献13

引证文献3

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部