一种进行K-Means聚类的有效方法被引量：28

An Efficient Method for K-Means Clustering

导出

摘要现有的K-Means聚类算法均直接作用于多维数据集上,因此,当数据集基数和聚类属性个数较大时,这些聚类算法的效率极其低下.为此,文中提出一种基于正规格结构的有效聚类方法(KMCRG).KMCRG算法以单元格为处理对象来有效完成K-Means聚类工作.特别,该算法使用格加权迭代的策略来有效返回最终的K个类.实验结果表明,KMCRG算法在不损失聚类精度的基础上能够快速返回聚类结果. The existing K-Means clustering methods directly act on multidimensional datasets. Hence, these methods are extremely inefficient as the cardinality of input data and the number of clustering attributes increase. Motivated by the above fact, in this paper, an efficient approach for K-Means clustering based on the structure of regular grid, called KMCRG （ K-Means Clustering based on Regular Grid）, is proposed. This method effectively implements K-Means clustering by taking cell as handling object. Especially, this method uses the tactics of grid weighted iteration to effectively gain the final K classes. The experiment results show that the algorithm can quickly gain the clustering results without losing clustering precision.

作者黄震华向阳张波王栋刘啸岭

机构地区同济大学计算机科学与技术系复旦大学计算机与信息技术系

出处《模式识别与人工智能》 EI CSCD 北大核心 2010年第4期516-521,共6页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金项目(No.60903032 70771077) 教育部博士点基金项目(No.20090072120056) 国家863计划项目(No.2008AA04Z106)资助

关键词 K-MEANS聚类正规格结构性能评估 K-Means Clustering, Regular Grid Structure, Performance Evaluation

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1MacQueen J.Some Methods for Classification and Analysis of Multivariate Observations//Proc of the 5th Berkeley Symposium on Mathematical Statistics and Probability.Berkeley,USA,1967:281-297.
2Tou J.Pattern Recognition Principles.Reading,USA:AddisonWesley,1974.
3Linde Y,Buzo A,Gary R.An Algorithm for Vector Quantizer Design.IEEE Trans on Communication,1980,28(1):84-95.
4Chomicki J,C,odfrey P,Gryz J,et al.Skyline with Presorting:Theory and Optimization//Proc of the International Conference on Intelligent Information Systems.Wroclaw,Poland,2005:216-225.
5Birgin E G,Martinez J M,Ronconi D P.Minimization Suhproblems and Heuristics for an Applied Clustering Problem.European Journal of Operational Research,2003,146(1):19-34.
6Kanungo T,Mount D M,Netanyaha N S,et al.An Efficient K-Means Clustering Algorithm:Analysis and Implementation.IEEE Trans on Pattern Analysis and Machine Intelligence,2002,24(7):881-892.
7Ester M,Kriegel H,Sander J,et al.A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise//Proc of the 2nd International Conference.on Knowledge Discovery and Data Mining.Portland,USA,1996:226-231.
8Corral A,Almendros J M.A Performance Comparison of DistanceBased Query Algorithms Using R-Trees in Spatial Databases.Information Sciences:An International Journal,2007,177(11):2207-2237.
9Pei Jian,Jin Wen,Ester M,et al.Catching the Best Views of Skyline:A Semantic Approach Based on Decisive Subspaces//Proc o the 31st International Conference on Very Large Data Bases.Trondheim,Norway,2005:253-264.
10Xiong Xiaopeng,Mokbel M F,Aref W G.SEA-CNN:Scalable Processing of Continuous k-Nearest Neighbor Queries in Spatio and Temporal Databases//Proc of the 21st International Conference on Data Engineering.Tokyo,Japan,2005:643-654.

同被引文献240

1王伟龙,朱锦艳.吴起油田CJN油区长4+5油藏分布特征[J].云南化工,2021,48(5):138-140. 被引量：1
2朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
3张石磊,武装.一种基于Hadoop云计算平台的聚类算法优化的研究[J].计算机科学,2012,39(S2):115-118. 被引量：29
4李俊山,马颖,赵方舟,郭莉莎.改进的Canny图像边缘检测算法[J].光子学报,2011,40(S1):50-54. 被引量：64
5刘岳.现代地图学发展的主要特征和今后方向[J].中国测绘,2002(1):39-42. 被引量：15
6刘颖超,张纪元.梯度下降法[J].华东工学院学报,1993(2):12-16. 被引量：43
7黄劲松,赵平.聚类分析在品牌市场定位研究中的应用[J].数理统计与管理,2005,24(1):21-26. 被引量：15
8董超俊,刘智勇,邱祖廉.城市交通控制智能优化配时及仿真[J].系统仿真学报,2005,17(2):472-475. 被引量：7
9贾伯岩,李璠,刘宏亮.脉冲磁控放电法测量真空断路器真空度现场使用及分析[J].河北电力技术,2005,24(1):36-38. 被引量：2
10刘宝华,王冬容,曾鸣.从需求侧管理到需求侧响应[J].电力需求侧管理,2005,7(5):10-13. 被引量：42

引证文献28

1王晓静,原达,李道凯.基于Krawtchouk矩的运动目标分类[J].计算机工程与设计,2012,33(5):1890-1893. 被引量：2
2周爱武,陈宝楼,王琰.K-Means算法的研究与改进[J].计算机技术与发展,2012,22(10):101-104. 被引量：19
3李惠君,李志全.基于改进雷达图的可视化聚类方法研究[J].燕山大学学报,2013,37(1):58-62. 被引量：2
4刘忠宝,赵文娟.基于熵理论的单类学习机[J].计算机应用与软件,2013,30(11):99-101. 被引量：1
5陈思慧.基于MIP和改进模糊K-Means算法的大数据聚类设计[J].计算机测量与控制,2014,22(4):1270-1272. 被引量：4
6张桂梅,王大雷.结合LPG&PCA的中智学图像分割[J].中国图象图形学报,2014,19(5):693-700. 被引量：8
7沈吟东,张仝辉,徐甲.基于K-means聚类算法的公交运营时段分析[J].交通运输系统工程与信息,2014,14(2):87-93. 被引量：18
8李萌,李伟,钱凌韬.基于文本挖掘的个性化地图服务模型研究[J].测绘与空间地理信息,2014,37(5):39-41. 被引量：2
9宗春梅,赵青杉,焦莉娟.基于簇内差异度的K-均值算法应用研究[J].忻州师范学院学报,2018,34(5):26-30.
10侯荣涛,路郁,王琴,周彬.基于精细簇的K-Means文本聚类[J].计算机工程与设计,2015,36(7):1794-1799. 被引量：2

二级引证文献124

1郑帅,吕芳.模糊K-means算法在临床路径决策中的应用[J].辽宁师专学报（自然科学版）,2019,21(3):81-88. 被引量：3
2金娟娟.啤酒的总酸及其测定[J].酿酒科技,2000(3):56-57. 被引量：10
3闫新庆,王换换,栗青霞,傅喆.基于改进K-Means聚类的煤炭交易者信誉度划分[J].计算机工程与应用,2014,50(2):231-236. 被引量：1
4徐立,廖名学,郑昌文.基于改进K-means的多门限能量检测法[J].计算机仿真,2014,31(4):207-211.
5张宝华,刘鹤,侯贺.基于多聚类中心和PCNN的医学图像融合算法[J].激光与红外,2014,44(4):452-456. 被引量：1
6余彪,万水龙,刘进,王强德.基于Krawtchouk-RBF的印章图像分类识别[J].微型机与应用,2014,33(6):44-47. 被引量：1
7李雷,施冬艳.基于自动样本和PSO优化组合核的图像分割[J].计算机技术与发展,2014,24(6):79-82. 被引量：1
8万水龙,刘进,余彪.基于Contourlet域KPCA-Krawtchouk矩的印章图像配准[J].微型机与应用,2014,33(4):81-83.
9王文宪,肖蒙,成琳娜,杜延帅,倪少权.基于近邻传播聚类的地铁运营时段划分[J].运筹与管理,2018,27(12):187-192. 被引量：8
10石连生,苟蕾,汪文俊.海口市路段公交线路重复系数的分析[J].海南大学学报（自然科学版）,2014,32(4):307-315.

1xrwl.1步!激活Vista的离开模式[J].电脑爱好者,2008,0(8):37-37.
2刘侍刚,吴成柯,唐丽,贾静.一种鲁棒性的射影重建方法——加权迭代法[J].计算机科学,2005,32(10):187-189. 被引量：3
3彭石宝,袁俊泉,向家彬.InSAR加权迭代贪婪算法相位解缠及性能分析[J].信号处理,2008,24(4):672-675.
4刘迎春,郑小林,陈德人.基于信任和推荐关系的可信服务发现[J].系统工程理论与实践,2012,32(12):2789-2795. 被引量：10
5王伟,张金艺,张洪辉,蔡春艳,李建宇.异质双9轴MEMS惯性传感器数据互补-加权迭代融合算法[J].应用科学学报,2015,33(5):491-501. 被引量：1
6郭芬,闻立杰,王建民,丁子哲,高翔.海量流程实例的存储、索引与检索[J].计算机集成制造系统,2015,21(2):359-367. 被引量：2
7孔兰菊,李庆忠,史玉良,王学.面向SaaS应用基于键值对模式的多租户索引研究[J].计算机学报,2010,33(12):2239-2247. 被引量：17
8张哲,宣琦,马晓迪,傅晨波,俞立.加权迭代节点匹配算法及其在语言网络中的应用[J].计算机系统应用,2014,23(8):173-177.
9叶泰航,张书浆,徐建军.一种面向高架区域的GPS导航地图匹配算法[J].计算机时代,2014(4):37-39.
10刘明.深入Windows Vista系统还原高级应用[J].计算机与网络,2007(18):22-22.

模式识别与人工智能

2010年第4期

浏览历史

内容加载中请稍等...

一种进行K-Means聚类的有效方法被引量：28

参考文献10

同被引文献240

引证文献28

二级引证文献124

相关作者

相关机构

相关主题

浏览历史

一种进行K-Means聚类的有效方法 被引量：28

参考文献10

同被引文献240

引证文献28

二级引证文献124

相关作者

相关机构

相关主题

浏览历史

一种进行K-Means聚类的有效方法被引量：28