基于核自适应的近邻传播聚类算法被引量：9

Kernel-based adaptation for affinity propagation clustering algorithm

下载PDF

导出

摘要近邻传播聚类(AP)方法是近年来出现的一种广受关注的聚类方法,在处理多类、大规模数据集时,能够在较短的时间得到较理想的结果,因此与传统方法相比具有很大的优势。但是对于一些聚类结构复杂的数据集,往往不能得到很好的聚类结果。通过分析数据的聚类特性,设计了一种可以根据数据结构自动调整参数的核函数,数据集在其映射得到的核空间中线性可分或几乎线性可分,对该核空间中的数据集进行近邻传播聚类,有效提高了AP聚类的精确度和速度。算法有效性分析以及仿真实验验证了所提算法在处理大规模复杂结构数据集上的性能优于原始AP算法。 AP algorithm has become increasingly popular in recent years as an efficient and fast clustering algorithm.AP has better performance on large and multi-class dataset than the existing clustering algorithms.But for the datasets with complex cluster structures,it cannot produce good clustering results.Through analyzing the property of data clusters,this paper proposed a kernel function,optimized that the parameters automatically according to the dataset structure,and the dataset in kernel space were linearly separable or almost linearly.Carried AP on the kernel space,it had a kernel-adaptive affinity propagation clustering algorithm（KA-APC）.Compared with the original AP clustering,it had the advantages of effectively dealing with the large multi-scale dataset.The promising experimental results show that this algorithm outperforms the original AP algorithm.

作者付迎丁兰巨龙

机构地区国家数字交换系统工程技术研究中心

出处《计算机应用研究》 CSCD 北大核心 2012年第5期1644-1647,1650,共5页 Application Research of Computers

基金国家"863"计划资助项目(2009AA01A346)

关键词近邻传播聚类核聚类核自适应聚类流形学习 affinity propagation（AP） kernel clustering kernel adaptive clustering manifold learning

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1076
2GELBARD R,GOLDMAN O,SPIEGLER I.Investigating diversity of clustering methods:an empirical comparison[J].Data&Knowledge Engineering,2007,63(1):155-166.
3FREY B J,DUECK D.Clustering by passing messages between data points[J].Science,2007,315(5814):972-976.
4KANG J H,LERMAN K,PLANGPRASOPCHOK A.Analyzing mi-croblogs with affinity propagation[C]//Proc of the1st Workshop on Social Media Analytics.New York:ACM Press,2010:67-70.
5CHEN Yang,LORENZO B,SUN Feng-yue,et al.A fuzzy statistics based affinity propagation technique for clustering in multispectral im-ages[J].IEEE Trans on Geosciences and Remote Sensing,2010,48(6):2647-2659.
6GIVONI E,FREY B J.A binary variable model for affinity propaga-tion[J].Neural Computation,2009,21(6):1589-1600.
7崔鹏,张汝波.基于核自调整进行半监督聚类[J].计算机应用研究,2009,26(5):1719-1722. 被引量：2
8董俊,王锁萍,熊范纶.可变相似性度量的近邻传播聚类[J].电子与信息学报,2010,32(3):509-514. 被引量：49
9BRRAND M.Charting a manifold[M]//Advances in Neural Informa-tion Processing Systems.Cambridge,MA:MIT Press,2003.
10NG A Y,JORDAN M I,WEISS Y.On spectral clustering:analysis and an algorithm[M]//Advances in Neural Information Processing Systems.Cambridge,MA:MIT Press,2002:856-864.

二级参考文献24

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
2DHILLON I, GUAN Yu-qiang, KULIS B, et al, Kernel K-means: spectral clustering and normalized cuts[ C]//Proc of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York : ACM Press, 2004:345- 347.
3BASU S, BILENKO M, MOONEY R, et al. A probabilisfic framework for semi-supervised clustering [ C ]//Proc of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York : ACM Press. 2004 : 1248-1252.
4CRISTIANINI N, SHAWE-TAYLOR J, ELISSEEFF A, et al. On kernel-target alignment[ J ]. Neural Information Processing Systems ,2001,36 (9) : 103-110.
5CHAPELLE O, VAPNIK V. Choosing mutiple parameters for support vector machines [ J ]. Machine Learning, 2002,46 ( 1- 3 ) : 131- 159.
6WANG Wen-jian, XU Z, LU W, et al.Determination of the spread parameter in the gaussian kernel for classification and regression [ J ]. Neuro Computing, 2002, 55 (3) : 645-650.
7HUANG Jian, YUEN P C, CHEN Wen-sheng, et al. kernel subspace LDA with optimized Kernel parameters on face recognition [ C]//Proc of the 6th IEEE International Conference on Automatic Face and Gesture Recognition. 2004 : 2115- 2118.
8NATESH S, WU Qiang, LIANG Feng. Characterizing the function space for Bayesian kernel models [ J ]. Machine Learning Research, 2007,46 ( 8 ) : 1770-1778.
9LOWED G. Similarity metric learning for a variable-kernel classifier [ J]. Neural Computation, 1995,7( 1 ) :72-85.
10BASU S, BANERJEE A, MOONEY R. Semi-supervised clustering by seeding[ C]//Proc of the 19th International Conference on Machine Learning. San Francisco:Morgan Kanfmann Publishers, 2002:19-26.

共引文献1119

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：4
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献55

1于剑,程乾生.The upper bound of the optimal number of clusters in fuzzy clustering[J].Science in China(Series F),2001,44(2):119-125. 被引量：6
2张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
3杨涛,骆嘉伟,王艳,吴君浩.基于马氏距离的缺失值填充算法[J].计算机应用,2005,25(12):2868-2871. 被引量：24
4王开军,张军英,李丹,张新娜,郭涛.自适应仿射传播聚类[J].自动化学报,2007,33(12):1242-1246. 被引量：145
5孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1076
6马瑞,王家廞,宋亦旭.基于局部线性嵌入(LLE)非线性降维的多流形学习[J].清华大学学报（自然科学版）,2008,48(4):582-585. 被引量：48
7李勇,陈贺新,赵刚,孙中华,陈绵书.基于可变k近邻LLE数据降维的图像检索方法[J].吉林大学学报（工学版）,2008,38(4):946-949. 被引量：10
8肖宇,于剑.基于近邻传播算法的半监督聚类[J].软件学报,2008,19(11):2803-2813. 被引量：165
9支晓斌,范九伦.基于模糊Fisher准则的自适应降维模糊聚类算法[J].电子与信息学报,2009,31(11):2653-2658. 被引量：6
10董俊,王锁萍,熊范纶.可变相似性度量的近邻传播聚类[J].电子与信息学报,2010,32(3):509-514. 被引量：49

引证文献9

1赵小强,谢亚萍.基于局部线性嵌入的半监督仿射传播聚类算法[J].兰州理工大学学报,2015,41(1):96-100. 被引量：3
2左进,陈泽茂.基于改进K均值聚类的异常检测算法[J].计算机科学,2016,43(8):258-261. 被引量：51
3覃华,詹娟娟,苏一丹.基于概率无向图模型的近邻传播聚类算法[J].控制与决策,2017,32(10):1796-1802. 被引量：9
4支晓斌,郝踩云.基于马氏距离的近邻传播聚类算法[J].西安邮电大学学报,2017,22(6):46-49. 被引量：2
5赵昱,陈琴,苏一丹,陈慧姣.基于邻域相似度的近邻传播聚类算法[J].计算机工程与设计,2018,39(7):1883-1888. 被引量：5
6孙劲光,赵欣.一种改进近邻传播聚类的图像分割算法[J].计算机工程与应用,2017,53(6):178-182. 被引量：18
7Qi Zhu,Huifu Zhang,Quanqin Yang.Semi-supervised Affinity Propagation Clustering Based on Subtractive Clustering for Large-Scale Data Sets[J].国际计算机前沿大会会议论文集,2015(1):76-77.
8马翩翩,张新刚,梁晶晶.基于萤火虫算法的近邻传播聚类研究[J].网络安全技术与应用,2019,0(12):48-50.
9张安勤,吴蕊,张挺.基于信息熵的异常检测算法[J].上海电力大学学报,2020,36(4):386-390. 被引量：9

二级引证文献96

1潘春燕,张仁崇,杨忠保.密度偏差抽样在近邻传播聚类中的应用[J].商丘师范学院学报,2022,38(12):4-8.
2李飞谷,张玉香,朱峰波,温良涛.提高地方煤质数据库应用价值的途径[J].中国科技纵横,2018,0(17):167-168. 被引量：1
3赵小强,王涛.基于SPA间歇过程故障诊断的MKNPE算法[J].兰州理工大学学报,2016,42(3):82-87. 被引量：7
4冯小芹,何宏,胡晓辉,孙晨旭,向朝参,喻赛萱.基于K-means聚类的大学生综合素质评定方法[J].重庆理工大学学报（自然科学）,2017,31(5):125-132. 被引量：4
5唐丹,张正军.近邻传播聚类算法的优化[J].计算机应用,2017,37(A01):258-261. 被引量：7
6王东,张强,严亮.一种融合聚类的监督局部线性嵌入算法研究[J].半导体光电,2017,38(3):419-424. 被引量：2
7符运阳,郭胜娜,王兵,王光光.基于LAB颜色空间的植物病变区域提取[J].电子世界,2017,0(20):105-106. 被引量：3
8王惠杰,王雷雨.基于正反平衡校验的入炉煤质在线监测[J].电力科学与工程,2017,33(10):40-44. 被引量：2
9郑德俊,朱婷婷,沈军威.基于改进K均值算法的移动图书馆用户评论需求聚类研究[J].数字图书馆论坛,2017(10):26-31. 被引量：2
10贾晓婷,王名扬,曹宇.结合Doc2Vec与改进聚类算法的中文单文档自动摘要方法研究[J].数据分析与知识发现,2018,2(2):86-95. 被引量：20

1胡晨晓,邹显春,陈武,杨阳.基于稀疏表示的近邻传播聚类算法[J].西南大学学报（自然科学版）,2014,36(5):220-224. 被引量：6
2王袁芳,王灵艳,程碧辉.有关基于云模型的聚类特性的应用研究[J].计算机光盘软件与应用,2013,16(23):104-105.
3靳华中.基于云模型的聚类特性分析[J].湖北农机化,2011(2):60-61.
4许喆,薛智锋,陈福才.基于改进的近邻传播学习算法的视频拷贝检测[J].计算机工程与设计,2014,35(9):3185-3189. 被引量：4
5瑞立.Linux硬盘性能优化[J].网管员世界,2007(15):59-59.
6罗敏,阴晓光,张焕国,王丽娜.基于孤立点检测的入侵检测方法研究[J].计算机工程与应用,2007,43(13):146-149. 被引量：6
7李洪.Visual FoxPro数据库的加密技术分析[J].石河子科技,2014(2):17-18.
8郭秀娟,陈莹.AP聚类算法的分析与应用[J].吉林建筑工程学院学报,2013,30(4):58-61. 被引量：12
9宋启祥,张明玉,张锏.基于核聚类的MRI和PET医学图像分割方法[J].宿州学院学报,2005,20(1):88-90. 被引量：1
10丁卫平,邓伟.一种基于约束关系的电子病历图像分割核聚类算法[J].计算机应用,2007,27(8):2066-2068. 被引量：2

计算机应用研究

2012年第5期

浏览历史

内容加载中请稍等...

基于核自适应的近邻传播聚类算法被引量：9

参考文献10

二级参考文献24

共引文献1119

同被引文献55

引证文献9

二级引证文献96

相关作者

相关机构

相关主题

浏览历史

基于核自适应的近邻传播聚类算法 被引量：9

参考文献10

二级参考文献24

共引文献1119

同被引文献55

引证文献9

二级引证文献96

相关作者

相关机构

相关主题

浏览历史

基于核自适应的近邻传播聚类算法被引量：9