基于平均差异度优选初始聚类中心的改进K-均值聚类算法被引量：30

Improved K-means clustering algorithm optimizing initial clustering centers based on average difference degree

导出

摘要针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快. Aiming at the dependence on initial clustering centers of the K-means clustering algorithm,an improved algorithm is proposed.In the improved K-means algorithm,the initial clustering centers are selected according to the distribution of data spatial.The distance between two samples,the average difference of each sample,and total average difference of sample set are defined.Then the average difference of each sample is sorted.The sample with larger average difference is selected as the initial clustering center if its difference from the selected cluster is larger than average difference.Experimental results show that the stability and accuracy of the clustering results are increased by using the improved algorithm,and the convergence speed is also accelerated.

作者李武赵娇燕严太山

机构地区湖南理工学院信息与通信工程学院

出处《控制与决策》 EI CSCD 北大核心 2017年第4期759-762,共4页 Control and Decision

基金国家自然科学基金项目(61473118) 湖南省自然科学基金项目(2015JJ2074) 湖南省高校创新平台开放基金项目(13K102) 湖南省科技计划项目(2016TP1021)

关键词 K-均值聚类初始聚类中心样本差异度 K-means clustering initial clustering center sample difference

分类号 N945 [自然科学总论—系统科学]

引文网络
相关文献

参考文献7

1黄月,吴成东,张云洲,程龙,孙尧.基于K均值聚类的二进制传感器网络多目标定位方法[J].控制与决策,2013,28(10):1497-1501. 被引量：4
2施侃晟,刘海涛,宋文涛.基于词性和中心点改进的文本聚类方法[J].模式识别与人工智能,2012,25(6):996-1001. 被引量：6
3邢长征,谷浩.基于平均密度优化初始聚类中心的k-means算法[J].计算机工程与应用,2014,50(20):135-138. 被引量：32
4郑超,苗夺谦,王睿智.基于密度加权的粗糙K-均值聚类改进算法[J].计算机科学,2009,36(3):220-222. 被引量：25
5何云斌,肖宇鹏,万静,李松.基于密度期望和有效性指标的K-均值算法[J].计算机工程与应用,2013,49(24):105-111. 被引量：10
6赖玉霞,刘建平,杨国兴.基于遗传算法的K均值聚类分析[J].计算机工程,2008,34(20):200-202. 被引量：72
7徐泽水.基于相离度和可能度的偏差最大化多属性决策方法[J].控制与决策,2001,16(B11):818-821. 被引量：53

二级参考文献77

1陈浩,何婷婷,姬东鸿.基于k-means聚类的无导词义消歧[J].中文信息学报,2005,19(4):10-16. 被引量：16
2杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：191
3刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量：65
4潘伟,刁华宗,井元伟.一种改进的实数自适应遗传算法[J].控制与决策,2006,21(7):792-795. 被引量：53
5任江涛,施潇潇,孙婧昊,黄焕宇,印鉴.一种改进的基于特征赋权的K均值聚类算法[J].计算机科学,2006,33(7):186-187. 被引量：10
6赵世奇,刘挺,李生.一种基于主题的文本聚类方法[J].中文信息学报,2007,21(2):58-62. 被引量：23
7袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：153
8陈Ting.决策分析[M].北京:科学出版社,1987..
9Pawlak Z. Rough sets. International Journal of Information and Computer Sciences, 1982,11 : 145-172
10Lingras P, West C. Interval set clustering of web users with rou - gh k-means. Journal of Intelligent Information Systems, 2004,23 (1):5-1643

共引文献194

1徐辉,李石君.一种整合粒子群优化和K-均值的数据聚类算法[J].山西大学学报（自然科学版）,2011,34(4):518-523. 被引量：9
2刘伯颖,张素琪,张丽丽.一种引力搜索和K-means的混合聚类算法[J].河北工业大学学报,2013,42(3):23-27. 被引量：3
3姜月秋,牛硕,高宏伟.一种新的基于K均值聚类的色彩量化算法研究[J].计算机科学,2012,39(S3):375-377. 被引量：6
4叶志伟,尹宇洁,王明威,赵伟.一种基于杜鹃搜索算法的聚类分析方法[J].微电子学与计算机,2015,32(5):104-110. 被引量：6
5侯志东,吴祈宗.基于Hausdauff度量的模糊TOPSIS方法研究[J].数学的实践与认识,2005,35(3):233-237. 被引量：10
6许叶军,达庆利.基于理想点的多属性决策主客观赋权法[J].工业工程与管理,2005,10(4):45-47. 被引量：31
7曾三云,曾玲.带有方案偏好关系的区间型多属性决策方法[J].广西科学,2005,12(3):184-186. 被引量：3
8柏明国,朱金福.航空公司航线决策的一种方法[J].统计与决策,2005,21(10X):151-153. 被引量：3
9柏明国,朱金福,姚韵.基于可能度的多混合属性决策方法[J].商业研究,2006(14):19-21. 被引量：1
10齐照辉,张为华,范玉珠.一种新型区间数多属性决策算法研究[J].运筹与管理,2006,15(4):51-55. 被引量：11

同被引文献243

1Jingshu Liu,Li Wang,Jinglei Liu.Efficient Preference Clustering via Random Fourier Features[J].Big Data Mining and Analytics,2019,2(3):195-204. 被引量：1
2刘春涛,陈祥光,刘志成.多传感器信息融合技术在动态油量计量中的应用[J].仪器仪表学报,2005,26(z1):43-46. 被引量：8
3王云松,付玉红,宋艳慧.储油罐多相界面液位测控系统的研究[J].仪器仪表学报,2003,24(z1):285-286. 被引量：4
4任喜伟,任工昌,杨帆.电磁场式油水界面测量分析及数据优化方法[J].化工自动化及仪表,2012,39(7):858-861. 被引量：8
5董雷,周文萍,张沛,刘广一,李伟迪.基于动态贝叶斯网络的光伏发电短期概率预测[J].中国电机工程学报,2013,33(S1):38-45. 被引量：77
6陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
7彭勇,张映辉.光纤油水界面监控仪研制与应用[J].仪器仪表学报,2005,26(8):857-859. 被引量：7
8曲艺,陈祥光.原油储罐油量动态计量技术研究[J].仪器仪表学报,2005,26(10):998-1001. 被引量：17
9张显,王锡凡.短期电价预测综述[J].电力系统自动化,2006,30(3):92-101. 被引量：75
10黄晓莉,曾黄麟,王秀碧.基于模糊C均值聚类的粗集理论连续属性的离散化新算法[J].重庆邮电学院学报（自然科学版）,2006,18(5):650-652. 被引量：6

引证文献30

1于玲玲,独家卿,陈龙.改进的K-均值算法在商业客户识别中的应用研究[J].通化师范学院学报,2017,38(10):75-77. 被引量：2
2王日宏,崔兴梅.融合集群度与距离均衡优化的K-均值聚类算法[J].计算机应用,2018,38(1):104-109. 被引量：3
3韦祥,李本威,张赟.采用符号时间序列分析的轴承早期微弱故障预警[J].西安交通大学学报,2018,52(6):84-90. 被引量：3
4赵小强,刘晓丽.基于公理化模糊子集的改进谱聚类算法[J].电子与信息学报,2018,40(8):1904-1910. 被引量：5
5陆勰,罗守山,张玉梅.基于Hadoop的海量安全日志聚类算法研究[J].信息网络安全,2018(8):56-63. 被引量：6
6周世波,徐维祥.一种基于相对密度和决策图的聚类算法[J].控制与决策,2018,33(11):1921-1930. 被引量：8
7王俊博,金琦,杨国东,张旭晴,詹国旗,邵鹏.一种基于面向对象辅以DSM的建筑物提取方法[J].世界地质,2018,37(4):1258-1264. 被引量：1
8任喜伟,何立风,姚斌,宋安玲,钟岩,刘艳玲.油水界面测量过程中自适应阈值聚类优化算法[J].化工进展,2019,38(2):779-789. 被引量：5
9孙旻,张大,曾伟,彭春华.计及光伏消纳率的分布式光伏电源双层多场景规划[J].现代电力,2019,36(2):17-24. 被引量：12
10刘良凤,刘三阳.基于权重差异度的动态模糊聚类算法[J].吉林大学学报（理学版）,2019,57(3):574-582. 被引量：9

二级引证文献191

1俞志龙,杨明辉.基于机器学习算法的数据安全稽核模型搭建[J].信息网络安全,2020(S01):1-5. 被引量：2
2刘朝辉,汪晓玲,贺诚,王中杰.基于自适应动态贝叶斯网络的无人平台不确定推理机制研究[J].系统仿真技术,2023,19(4):319-325.
3刘盛,吴辰,杨浩楠,段奥,呼延明,李国强.基于SLP方法和层次分析法的刀具车间布置优化[J].工业技术创新,2021,8(3):147-152. 被引量：2
4全球片式电容器面面观(之一)[J].世界产品与技术,2000(1):42-43. 被引量：2
5冉玉平.口服伊曲康唑、外用采乐洗剂等治疗糠秕孢子菌毛囊炎1例[J].临床皮肤科杂志,2000,29(2):108-108. 被引量：8
6赵颖,王华伟.基于聚类分析算法的铁路通信设备厂商信息智能分类[J].铁路计算机应用,2018,27(7):75-79. 被引量：1
7张磊,徐华,裴世源.滑动轴承椭圆度对转子加速过程振动响应的影响[J].西安交通大学学报,2018,52(9):19-27. 被引量：2
8张春霞,王新猛,张晓熙.基于Hadoop的森林公安网络舆情监测系统设计与实现[J].信息网络安全,2018(12):82-86. 被引量：8
9王玙.基于聚类算法的企业管理系统的设计[J].电子设计工程,2019,27(4):47-51. 被引量：3
10王治和,黄梦莹,杜辉,秦红武.基于密度峰值与密度聚类的集成算法[J].计算机应用,2019,39(2):398-402. 被引量：5

1王小红.改进的K-均值聚类算法在社团划分中的应用[J].青海师范大学学报（自然科学版）,2009,25(2):22-24.
2黄纬,温志萍,程初.云计算中基于K-均值聚类的虚拟机调度算法研究[J].南京理工大学学报,2013,37(6):807-812. 被引量：17
3骆正山,邢书宝.基于聚类的编网法矿体矿石模块品位预测[J].东北大学学报（自然科学版）,2004,25(z1):38-40.
4常征,黄明,常静.一种改进的遗传算法在车间调度中的应用[J].山东理工大学学报（自然科学版）,2005,19(1):64-67.
5邓露,许爱强,李文海,孟上.基于关联模型的故障样本集覆盖性定量评价方法[J].计算机测量与控制,2014,22(1):28-30. 被引量：1
6宋捷,姚天祥,徐宁,党耀国.决策者剔除的重复群决策方法[J].控制与决策,2016,31(3):564-570.
7徐辉,李石君.一种整合粒子群优化和K-均值的数据聚类算法[J].山西大学学报（自然科学版）,2011,34(4):518-523. 被引量：9
8秦寿康,傅荣林,陈湛本.评价方案择优方法[J].广州师院学报（自然科学版）,1998,19(11):97-102. 被引量：1
9高博,刘晓乐.模糊聚类在客户关系管理中的应用与研究[J].河南工程学院学报（自然科学版）,2009,21(2):24-27.
10唐四云.运输问题表上作业法中初始方案的改进[J].广东技术师范学院学报,2016,37(5):39-42. 被引量：2

控制与决策

2017年第4期

浏览历史

内容加载中请稍等...

基于平均差异度优选初始聚类中心的改进K-均值聚类算法被引量：30

参考文献7

二级参考文献77

共引文献194

同被引文献243

引证文献30

二级引证文献191

相关作者

相关机构

相关主题

浏览历史

基于平均差异度优选初始聚类中心的改进K-均值聚类算法 被引量：30

参考文献7

二级参考文献77

共引文献194

同被引文献243

引证文献30

二级引证文献191

相关作者

相关机构

相关主题

浏览历史

基于平均差异度优选初始聚类中心的改进K-均值聚类算法被引量：30