摘要
根据文本信息在聚类过程中的特点构建了一种基于K-medoids的文档聚类方法,并结合文本特征提取KNN算法对训练文本进行测试,该方法首先利用K-medoids在聚类过程中实现简单、收敛速度快的特性,再利用KNN算法在文档特征提取过程中简单、高效的特点,对训练进行聚类划分。实验结果表明,利用该方法在对文档进行聚类时,F1值、耗时及分割数等方面与KNN及CLKNN算法相比都有较大提高。
出处
《软件导刊》
2016年第8期13-15,共3页
Software Guide
基金
国家自然科学基金项目(61262072)
广西高校教育厅项目(LX2014320)
CALIS广西壮族自治区文献信息服务中心预研项目(CALISGX2014006)