摘要
对缅甸文字进行文本挖掘,提出一种新的缅甸文字单字分割算法和词干提取算法.在向量空间模型下,使用Okapi相似度评测方法,评测缅甸文字文档与查询关键字之间的相关性,实现一个基于以上算法的缅甸文字文献检索系统.实验结果证明:所提出来的算法能够快速、有效地挖掘Web上的Html文档.
Propose a new algorithm of Myanmar word segmentation and Myanmar word stemming for Myanmar text mining. Under the vector space model, Okapi similarity method is used to evaluate the relationship between Myanmar text and the key words, consequently realize a Myanmar text retrieval system based on the algorithm above. The experimental results show that proposed by the algorithm can quickly and effectively mining the Html documents on the web.
出处
《华侨大学学报(自然科学版)》
CAS
北大核心
2013年第5期521-524,共4页
Journal of Huaqiao University(Natural Science)
基金
中央高校基本科研业务费专项基金资助项目
国务院侨办科研基金资助项目(09QZR02)