基于投票机制的融合聚类算法被引量：7

Custer Fusion Algorithm Based on Majority Voting Mechanism

下载PDF

导出

摘要以一趟聚类算法作为划分数据的基本算法,讨论聚类融合问题.通过重复使用一趟聚类算法划分数据,并随机选择阈值和数据输入顺序,得到不同的聚类结果,将这些聚类结果映射为模式间的关联矩阵,在关联矩阵上使用投票机制获得最终的数据划分.在真实数据集和人造数据集上检验了提出的聚类融合算法,并与相关聚类算法进行了对比,实验结果表明,文中提出的算法是有效可行的. Taking the one-pass clustering algorithm as the basic algorithm for grouping data, the issue of clustering ensemble is investigated. Over multiple clusters obtained by random threshold and sequence of data input of the one-pass clustering algorithm, produces a mapping of the clusters into an association matrix between patterns. The final data partition is obtained by voting mechanism over this association matrix. Experimental results of the proposed cluster fusion algorithm on several real and synthetic data sets are compared with clustering results produced by well known clustering algorithms. The experimental results show that the proposed algorithm is effective and practicable.

作者蒋盛益

机构地区广东外语外贸大学信息学院广东省信息安全技术重点实验室中山大学

出处《小型微型计算机系统》 CSCD 北大核心 2007年第2期306-309,共4页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(60503048 60673191)资金广东外语外贸大学重点项目(GW2005-1-012)资助.

关键词聚类分析一趟聚类算法聚类融合投票机制 cluster analysis one-pass clustering algorithm cluster fusion voting mechanism

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1Jiang Sheng-Yi,Xu Yu-Ming.An efficient clustering algorithm[C].In:Proc.of 2004 International Conference on Machine Learning and Cybernetics,2004,8:1513-1518.
2Ana Fred,Anil K Jain.Evidence accumulation clustering based on the K-Means algorithm[Z].SSPR/SPR,Windsor,2002:442-451.
3Alexander P Topchy,Behrouz Minaei-Bidgoli,Anil K Jain,et al.Adaptive clustering ensembles[C].17th International Conference on Pattern Recognition (ICPR'04):2004:272-275.
4Constantinos Boulis,Mari Ostendorf.Combining multiple clustering systems[C].8th European conference on Principles and Practice of Knowledge Discovery in Databases(PKDD),LNAI 3202/2004:63-74.
5Dimitrios Frossyniotis,Minas Pertselakis,Andreas Stafylopatis.A multi-clustering fusion algorithm[C].In:Proc.Of the Second Hellenic Conference on AI,2002:225-236.
6Strehl A,Ghosh J.Cluster ensembles-a knowledge reuse framework for combining multiple partitions[J].Journal of Machine Learning Research,2003,3(3):583-617.
7Merz C J,Merphy P.UCI repository of machine learning databases[EB/OL].URL:http://www.ics.uci.edu/～mlearn/MLRepository.html,2000,4.
8何增有,徐晓飞,邓胜春.Squeezer：An Efficient Algorithm for Clustering Categorical Data[J].Journal of Computer Science & Technology,2002,17(5):611-624. 被引量：32
9Guha S,Rastogi R,Shim K.ROCK:a robust clustering algorithm for categorical attributes[C].In:proceedings of the 15th ICDE,Sydney,Australia,1999:512-521.

二级参考文献17

1Sudipto Guha, Rajeev Rastogi, Kyuseok Shim. ROCK: A robust clustering algorithm for categorical attributes. In Proc. 1999 Int. Conf. Data Engineering, Sydney, Australia, Mar., 1999, pp.512-521.
2Alexandros Nanopoulos, Yannis Theodoridis, Yannis Manolopoulos. C2P: Clustering based on closest pairs. In Proc. 27th Int. Conf. Very Large Database, Rome, Italy, September, 2001, pp.331-340.
3Ester M, Kriegel H P, Sander J, Xu X. A density-based algorithm for discovering clusters in large spatial databases.In Proc. 1996 Int. Conf. Knowledge Discovery and Data Mining (KDD'96), Portland, Oregon, USA, Aug., 1996,pp.226-231.
4Zhang T, Ramakrishnan R, Livny M. BIRTH: An efficient data clustering method for very large databases. In Proc.the ACM-SIGMOD Int. Conf. Management of Data, Montreal, Quebec, Canada, June, 1996, pp.103-114.
5Sudipto Guha, Rajeev Rastogi, Kyuseok Shim. CURE: A clustering algorithm for large databases. In Proc. the ACM SIGMOD Int. Conf. Management of Data, Seattle, Washington, USA, June, 1998, pp.73-84.
6Karypis G, Han E-H, Kumar V. CHAMELEON: A hierarchical clustering algorithm using dynamic modeling. IEEE Computer, 1999, 32(8): 68-75.
7Sheikholeslami G, chatterjee S, Zhang A. WaveCluster: A multi-resolution clustering approach for very large spatial databases. In Proc. 1998 Int. Conf. Very Large Databases, New York, August, 1998, pp.428-439.
8Agrawal R, Gehrke J, Gunopulos D, Raghavan P. Automatic subspace clustering of high dimensional data for data mining applications. In Proc. the 1998 ACM SIGMOD Int. Conf. Management of Data, Seattle, Washington,USA, June, 1998, pp.94-105.
9Jiang M FI Tseng S S, Su C M. Two-phase clustering process for outliers detection. Pattern Recognition Letters,2001, 22(6/7): 691-700.
10Venkatesh Ganti, Johannes Gehrke, Raghu Ramakrishnan. CACTUS-clustering categorical data using summaries.In Proc. 1999 Int. Conf. Knowledge Discovery and Data Mining, August, 1999, pp.73-83.

共引文献31

1卓琳,赵厚宇,詹思延.异常检测方法及其应用综述[J].计算机应用研究,2020,37(S01):9-15. 被引量：25
2蒋盛益,李庆华.一种基于引力的聚类方法[J].计算机应用,2005,25(2):286-288. 被引量：9
3蒋盛益,李庆华.聚类分析中的差异性度量方法研究[J].计算机工程与应用,2005,41(11):146-149. 被引量：4
4蒋盛益,李庆华,李新.数据流挖掘算法研究综述[J].计算机工程与设计,2005,26(5):1130-1132. 被引量：21
5蒋盛益,李庆华,王卉,孟中楼.一种基于聚类的有指导的入侵检测方法[J].小型微型计算机系统,2005,26(6):1042-1045. 被引量：6
6蒋盛益,李庆华,赵延喜.一种两阶段异常检测方法[J].小型微型计算机系统,2005,26(7):1237-1240. 被引量：7
7蒋盛益,李庆华.基于引力的入侵检测方法[J].系统仿真学报,2005,17(9):2202-2206. 被引量：6
8郝凯,朱敏.有源雷达组网目标定位中去除虚假目标的改进方法[J].四川大学学报（自然科学版）,2006,43(2):315-319. 被引量：4
9蒋盛益,阮幼林,李庆华.面向混合属性的高效聚类算法研究[J].计算机工程,2006,32(12):47-49.
10李岩,王惠文,叶明.数据流分析与技术研究[J].计算机工程与应用,2008,44(15):8-11. 被引量：6

同被引文献78

1褚娜,马利庄,王彦.聚类趋势问题的研究综述[J].计算机应用研究,2009,26(3):801-803. 被引量：6
2梁敏君,倪志伟,倪丽萍,杨葛钟啸.基于网格与分形维数的聚类算法[J].计算机应用,2009,29(3):830-832. 被引量：4
3骆正清,杨善林.层次分析法中几种标度的比较[J].系统工程理论与实践,2004,24(9):51-60. 被引量：408
4唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
5蒋盛益,李庆华,赵延喜.一种两阶段异常检测方法[J].小型微型计算机系统,2005,26(7):1237-1240. 被引量：7
6阳琳贇,王文渊.聚类融合方法综述[J].计算机应用研究,2005,22(12):8-10. 被引量：28
7王丽娟,关守义,王晓龙,王熙照.基于属性权重的Fuzzy C Mean算法[J].计算机学报,2006,29(10):1797-1803. 被引量：45
8蒋盛益,李庆华.一种增强的k-means聚类算法[J].计算机工程与科学,2006,28(11):56-59. 被引量：15
9邹远强,李国徽,赵梓屹.基于遗传和蚁群算法融合的聚类新方法[J].科学技术与工程,2006,6(23):4700-4704. 被引量：9
10蒋盛益,姜灵敏.一种高效异常检测方法[J].计算机工程,2007,33(7):166-168. 被引量：7

引证文献7

1吴晓璇,倪志伟,倪丽萍.基于分形维数的聚类融合算法[J].吉林大学学报（工学版）,2012,42(S1):364-367. 被引量：1
2秦锋,陈奇明,程泽凯.聚类融合算法研究[J].计算机技术与发展,2010,20(7):106-108. 被引量：3
3苏晓珂,王秉政.基于聚类融合的异常检测算法[J].郑州轻工业学院学报（自然科学版）,2011,26(3):8-11. 被引量：1
4李建,李杰,孙燕花.基于聚类融合的入侵检测[J].计算机技术与发展,2011,21(10):250-252. 被引量：2
5查道丽,翟素兰,缪元武.基于层次分析法的加权聚类融合[J].内江师范学院学报,2013,28(4):8-11. 被引量：1
6蒋盛益,王连喜.聚类分析研究的挑战性问题[J].广东工业大学学报,2014,31(3):32-38. 被引量：6
7吴晓璇,倪志伟,倪丽萍,张琛.基于互信息和分形维数相结合的选择性聚类融合算法研究[J].模式识别与人工智能,2014,27(9):847-855. 被引量：1

二级引证文献15

1赵向梅,王艳君,刘林.聚类算法及聚类融合算法研究[J].电子设计工程,2011,19(15):4-5. 被引量：5
2李建,李杰,孙燕花.基于聚类融合的入侵检测[J].计算机技术与发展,2011,21(10):250-252. 被引量：2
3查道丽,翟素兰,缪元武.基于层次分析法的加权聚类融合[J].内江师范学院学报,2013,28(4):8-11. 被引量：1
4崔锡鑫,苏伟,刘颖.基于熵的流量分析和异常检测技术研究与实现[J].计算机技术与发展,2013,23(5):120-123. 被引量：6
5吴晓璇,倪志伟,倪丽萍.云计算环境下基于分形的聚类融合算法研究[J].计算机工程与应用,2015,51(14):1-6. 被引量：5
6王连喜.知识发现系统的相关性排序与主题聚类功能问题探析[J].图书馆工作与研究,2015(12):56-60. 被引量：4
7马金祥,范新南,张建生,韩庆邦,张金波,肖进.智能配电网大数据全景风险评估与自愈控制方法[J].工业仪表与自动化装置,2016(3):14-18. 被引量：6
8贺科达,朱铮涛,程昱.基于改进TF-IDF算法的文本分类方法研究[J].广东工业大学学报,2016,33(5):49-53. 被引量：22
9李丛颖,张果.社会经济发展与耕地变化协调度的时空格局分析——以成都市为例[J].内江师范学院学报,2016,31(10):57-62. 被引量：1
10王谦.基于网络流量异常检测的电网工控系统安全监测技术[J].网络安全技术与应用,2017(10):129-129. 被引量：13

1蔡龙征,余胜生,周敬利,王晓锋.一种无类标训练数据异常检测模型[J].小型微型计算机系统,2006,27(10):1856-1860. 被引量：2
2林国平.基于聚类的Web序列模式挖掘[J].漳州师范学院学报（自然科学版）,2005,18(4):21-27. 被引量：1
3黄珍,叶水生,吴霄.基于数据挖掘技术的系统审计机制[J].计算机工程与设计,2007,28(21):5108-5109.
4董震,朱晓光.数据仓库实践问题浅析[J].中国金融电脑,2005(9):61-63. 被引量：2
5王祥.小波分析与神经网络的网络流量预测模型[J].无线电工程,2012,42(6):8-11. 被引量：2
6殷亚林,刘爱民,周祥东.基于高阶相关聚类的脱机手写文本行分割[J].华中师范大学学报（自然科学版）,2017,51(1):18-22. 被引量：1
7何姗姗,詹文法,程玉胜.基于多个连续数据复制的幂次划分数据压缩方法[J].安庆师范学院学报（自然科学版）,2015,21(3):42-44.
8仲志平,仲晓辉.分布式数据库中冲突检测技术研究[J].计算机技术与发展,2012,22(1):217-220. 被引量：2
9王刚强,钟诚,柯琦.多核计算机上的快速傅里叶变换并行算法[J].计算机工程,2011,37(16):57-59. 被引量：8
10叶礼斌,张政.云计算环境下数据安全策略研究[J].信息与电脑,2016,28(11):213-214. 被引量：5

小型微型计算机系统

2007年第2期

浏览历史

内容加载中请稍等...

基于投票机制的融合聚类算法被引量：7

参考文献9

二级参考文献17

共引文献31

同被引文献78

引证文献7

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于投票机制的融合聚类算法 被引量：7

参考文献9

二级参考文献17

共引文献31

同被引文献78

引证文献7

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于投票机制的融合聚类算法被引量：7