-
题名一种改进的文本分类算法
被引量:5
- 1
-
-
作者
任朋启
王芳
黄树成
-
机构
江苏科技大学计算机科学与工程学院
-
出处
《电子设计工程》
2017年第18期1-5,共5页
-
基金
国家自然科学基金(61572498)
-
文摘
文本分类技术是文本挖掘技术中的研究热点之一,但是传统KNN分类算法的时间复杂度高,在不均匀密度样本下分类准确率低。针对这些问题,提出一种在不均匀密度样本下的优化KNN算法:IKNN算法。首先选取样本分类不均匀的训练样本,并对其中高密度样本做出相应的裁剪,以提高准确率。然后在此基础上,针对裁剪后的训练样本使用投影寻踪理论,选取更小的、更具代表性的样本库,以降低分类算法的时间复杂度。在此理论基础上,通过实验表明,在大量的训练样本下,与经典KNN算法相比,IKNN算法具有更高的效率和准确率。
-
关键词
文本分类
KNN算法
IKNN算法
样本裁剪
投影寻踪理论
-
Keywords
Text mining
KNN algorithm
IKNN algorithm
samples reduction
projection pursuit
-
分类号
TN02
[电子电信—物理电子学]
-