抽样子空间约束改进大数据谱聚类算法

Improved large data spectral clustering algorithm based on sampling subspace constraint

下载PDF

导出

摘要在分析经典谱聚目标函数与加权核k-means目标函数等价基础上,设计了一种基于抽样子空间约束的改进大规模数据谱聚类算法,算法通过加权核k-means迭代优化避免矩阵特征分解的大量资源被占用,通过数据抽样及聚类中心的子空间约束,避免全部核矩阵都被使用,从而降低经典算法的时间空间复杂度。理论分析和实验结果表明,改进算法保持与经典算法相近聚类精度,提高了聚类效率,验证了改进算法的有效性。 On the basis of analyzing the equivalent function of the objective function of classical spectral clustering algorithm and the weighted kernel k-means objective function,an improved large-scale data spectrum clustring algorithm based on sampling subspace constraint was designed,the weighted kernel k-means iterative optimization was used to avoid the large resource consumption of Laplacian matrix feature decomposition,and by using data sampling and constraining the cluster center to the subspace generated by the sampling points,the use of all kernel matrices was avoided,thereby reducing the time-space complexity of classical algorithms.Theoretical analysis and experi- mental results show that the improved algorithm can greatly improve the clustering efficiency on the basis of main- taining similar clustering accuracy with the classic algorithm and verify the effectiveness of the proposed algorithm.

作者聂茹 NIE Ru(Electronic Information Engineering Institute,Guangzhou College of South China University of Technology,Guangzhou 510800,China)

机构地区华南理工大学广州学院电子信息工程学院

出处《电信科学》 2018年第11期41-47,共7页 Telecommunications Science

基金广东省教育厅青年创新人才基金资助项目(No.2016KQNCX227)~~

关键词大规模数据谱聚类加权核k-means算法数据抽样矩阵特征分解核矩阵 large scale data spectral clustering weighted kernel k-means algorithm data sampling matrix feature decomposition kernel matrix

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1成宝芝,赵春晖,张丽丽,张健沛.联合空间预处理与谱聚类的协同稀疏高光谱异常检测[J].光学学报,2017,37(4):296-306. 被引量：12
2林顺富,田二伟,符杨,汤晓栋,李东东,王群京.基于信息熵分段聚合近似和谱聚类的负荷分类方法[J].中国电机工程学报,2017,37(8):2242-2252. 被引量：45
3刘春,邹海锋,向勇.大数据环境下电信数据服务能力开放研究[J].电信科学,2014,30(3):156-161. 被引量：24
4钱鹏江,王士同,邓赵红,徐华.基于最小包含球的大数据集快速谱聚类算法[J].电子学报,2010,38(9):2035-2041. 被引量：16
5杨艺,马儒宁.基于核心点的大数据谱聚类算法[J].中国科学技术大学学报,2016,46(9):757-763. 被引量：5
6朱光辉,黄圣彬,袁春风,黄宜华.SCoS:基于Spark的并行谱聚类算法设计与实现[J].计算机学报,2018,41(4):868-885. 被引量：13
7夏景明,唐玲玲,谈玲,郑晗.基于K-means和MTLS-SVM算法的生理参数监测系统[J].电信科学,2017,33(10):43-49. 被引量：2

二级参考文献48

1刘向东,骆斌,陈兆乾.支持向量机最优模型选择的研究[J].计算机研究与发展,2005,42(4):576-581. 被引量：49
2TIAN Zheng,LI XiaoBin,JU YanWei.Spectral clustering based on matrix perturbation theory[J].Science in China(Series F),2007,50(1):63-81. 被引量：19
3D J Higham.M Kibble.A Unified View of Spectral Clustering[M].England:Department of Mathematics,University of Strathclyde,2004.
4J Shi,J Malik.Normalized cuts and image segmentation[A].Proc IEEE Conf Computer Vision and Pattern Recognition[C].Washington:IEEE Computer Society,1997.731-737.
5J Shi,J Malik.Normalized cuts and image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):888-905.
6C Lee,O Zaiane,H Park,J Huang,R Greiner.Clustering high dimensional data:A graph-based relaxed optimization approach[J].Information Sciences,2008,178(23):4501-4511.
7M Meila,L Xu.Multiway Cuts and Spectral Clustering[M].Washington:Department of Statistics,University of Washington,2004.
8U Von Luxburg.A tutorial on spectral clustering[J].Statistics and Computing,2007,17(4):395-416.
9I Tsang,J Kwok,J Zurada.Generalized core vector machines[J].IEEE Transactions on Neural Networks,2006,17(5):1126-1139.
10I Tsang,J Kwok,P Cheung.Core vector machines:Fast SVM training on very large data sets[J].Journal of Machine Learning Research,2005,6:363-392.

共引文献105

1张景,闫德勤,于佳宁,刘德山.基于分层网络与局部约束的高光谱图像分类[J].智能计算机与应用,2022,12(4):61-69.
2钱鹏江,王士同,邓赵红.快速核密度估计定理和大规模图论松弛聚类方法[J].自动化学报,2011,37(12):1422-1434. 被引量：5
3王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012,27(3):321-328. 被引量：194
4王晨.产业组织优化与中国出版产业发展[J].中国出版,2000(2):18-20. 被引量：4
5丁阳,钱鹏江.医学图像分割中基于数据浓缩的谱聚类算法[J].计算机工程,2012,38(12):17-21. 被引量：2
6LU Zhimao,LIU Chen,ZHANG Qi,Massinanke Sambourou,FAN Dongmei.Super Large Data Sets Clustering by Means Radial Compression[J].Chinese Journal of Electronics,2013,22(2):335-340. 被引量：2
7史荧中,王士同,张景祥,倪彤光.面向非静态数据分类的演进支持向量机[J].电子与信息学报,2013,35(6):1413-1420.
8丛勤.谱聚类算法中的奇异解问题[J].自动化与信息工程,2013,34(2):6-9.
9鞠荟荟,刘志刚,汪洋.基于空谱联合的高光谱异常检测算法[J].激光与光电子学进展,2018,55(12):485-492. 被引量：3
10张江林,张亚超,洪居华,高红均,刘俊勇.基于离散小波变换和模糊K-modes的负荷聚类算法[J].电力自动化设备,2019,39(2):100-106. 被引量：23

1金海,张劲松,吴睿.一种基于抽样改进加权核K-means的大数据谱聚类算法[J].测绘通报,2018(11):78-82. 被引量：7
2肖文磊,刘亚醉,Oleksandr Zavalnyi,赵罡.T-SPLINE开源内核的三层数据结构及算法原理[J].计算机辅助设计与图形学学报,2017,29(11):2023-2036. 被引量：2
3尚玉皇,郑挺国.股市波动长期成分与宏观基本面的非线性格兰杰因果检验[J].数理统计与管理,2018,37(6):1102-1113. 被引量：4
4张乐园,李佳烨,李鹏清.低秩约束的非线性属性选择算法[J].计算机应用,2018,38(12):3444-3449.
5李爽,陈瑞瑞,林楠.面向大数据挖掘的Hadoop框架K均值聚类算法[J].计算机工程与设计,2018,39(12):3734-3738. 被引量：22
6黄春林,刘兴武,邓明华,周杨,卜东波.复杂网络上疾病传播溯源算法综述[J].计算机学报,2018,41(6):1376-1399. 被引量：16
7王志诚,徐卉,梁小溪,王珺,周起华,朱骏.基于卷积神经网络技术的直升机旋翼谱识别方法[J].上海航天,2018,35(6):103-111.
8《交通科技》杂志社.论文结论撰写要求[J].交通科技,2018,0(6):109-109. 被引量：1
9陈帆,孙自强.结合物品类型和密度峰值聚类的协同过滤推荐算法[J].华东理工大学学报（自然科学版）,2018,44(6):862-868. 被引量：3
10喻言.关于二叉树的加密算法[J].现代信息科技,2018,2(10):158-160.

电信科学

2018年第11期

浏览历史

内容加载中请稍等...

抽样子空间约束改进大数据谱聚类算法

参考文献7

二级参考文献48

共引文献105

相关作者

相关机构

相关主题

浏览历史