期刊文献+

一种改进的K-medoids知识聚类算法研究

下载PDF
导出
摘要 根据文本信息在聚类过程中的特点构建了一种基于K-medoids的文档聚类方法,并结合文本特征提取KNN算法对训练文本进行测试,该方法首先利用K-medoids在聚类过程中实现简单、收敛速度快的特性,再利用KNN算法在文档特征提取过程中简单、高效的特点,对训练进行聚类划分。实验结果表明,利用该方法在对文档进行聚类时,F1值、耗时及分割数等方面与KNN及CLKNN算法相比都有较大提高。
出处 《软件导刊》 2016年第8期13-15,共3页 Software Guide
基金 国家自然科学基金项目(61262072) 广西高校教育厅项目(LX2014320) CALIS广西壮族自治区文献信息服务中心预研项目(CALISGX2014006)
  • 相关文献

参考文献9

  • 1唐然,龙腾锐,龙向宇.基于模糊聚类的改进遗传算法[J].重庆大学学报(自然科学版),2008,31(2):166-169. 被引量:6
  • 2阮光册.基于知识关联的检索结果聚类分析研究[J].情报科学,2015,33(2):63-66. 被引量:5
  • 3杨欣欣,黄少滨.高阶异构数据层次联合聚类算法[J].计算机研究与发展,2015,52(1):200-210. 被引量:6
  • 4SHARIFI, ABOOSALEH M, AMIRGHOLIPOUR. Intrusion de- tection based on joint of k-means and knn[J]. Journal of Conver- gence Information Technology,2014(5) :45-52.
  • 5SHASI4IDHAR HV,SUBRAMANIAN VARADARAJAN. Customer segmentation of bank based on data mining security value based heuristic approach as a replacement to kmeans segmentation[J]. International Journal of Computer Applications, 2011 (5) : 66-72.
  • 6S VIMALA. Convergence analysis of eodehook generation teeh: niques for vector quantization using K-Means clustering technique [J]. International Journal of Computer Applications, 2011 (3) : 85- 92.
  • 7NAL1NI SINGH, AMBARISH G MOHAPATRA. Breast cancer mass detection in mammograms using kmeans and fuzzy cmeans clustering [J]. International Journal of Computer Applications, 2014 (3) : 34-40.
  • 8路永和,何新宇.文档相似矩阵在提高KNN分类效率中的应用[J].情报理论与实践,2014,37(1):141-144. 被引量:2
  • 9HEJIN YUAN,CUIRU WANG. A human action recognition algo- rithm based on semi-supervised kmeans clustering[J]. Transactions on Edutainment, 2014 (6): 47- 52.

二级参考文献47

  • 1陈涛,宋妍,谢阳群.基于IIG和LSI组合特征提取方法的文本聚类研究[J].情报学报,2005,24(2):203-209. 被引量:14
  • 2张国英,沙芸,江慧娜.基于粒子群优化的快速KNN分类算法[J].山东大学学报(理学版),2006,41(3):120-123. 被引量:8
  • 3刘红,韦穗.遗传算子的分析[J].计算机技术与发展,2006,16(10):80-82. 被引量:8
  • 4搜狐分类数据.http://www.sogou.com/labs/dl/c.html,[2008-9-1]
  • 5张文修 梁怡.遗传算法的数学基础[M].西安:西安交通大学出版社,2003..
  • 6杨伦标,高英仪.模糊数学原理及应用[M].广州:华南理工大学出版社,2003.
  • 7王小平,曹立明.遗传算法—理论、应用与软件实现[M].西安:西安交通大学出版社,2005.
  • 8KREINOVICH V,QUITANA C, FUENTES O. Genetic algorithms : what fitness scaling is optimal [ J ]. Cybernetics and Systems, 1993,24( 1 ) :9-36.
  • 9LYER, SRIKANTH, SAXENA K, et al. Improved genetic algorithm for the permutation flowshop scheduling problem [ J ]. Computer and Operation Research, 2004,31 (4) : 593-606.
  • 10GOLDBERG D E. Genetic algorithms in search, optimization, and machine learning[ M]. New York: Addison-wesley Publishing Company INC, 1989.

共引文献15

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部