一种基于粗糙集理论的谱聚类算法被引量：4

Rough-set Based Spectral Clustering

下载PDF

导出

摘要谱聚类算法利用特征向量构造简化的数据空间,在降低数据维数的同时,使得数据在子空间中的分布结构更加明显。现有谱聚类算法的聚类结果多为精确集,而真实数据集中重叠现象广泛存在。基于粗糙集理论提出了一种新的谱聚类算法,其主要思想是对谱聚类算法进行粗糙集扩展,使得聚类结果成为具有下近似和上近似定义的、类与类之间存在重叠区域的结构。实验表明,该算法与现有的谱聚类算法相比,稳定性和准确率都有一定的提高。 The spectral clustering algorithm constructs a simplified data space making the use of the eigenvectors that not only reduces the dimension of data but also gives clearer distribution of data in the subspace. The results of most existing spectral clustering algorithm are precise sets while widespread ＇ overlapping＇ exists in real data sets. This paper proposed a new spectral clustering algorithm which is based on the rough set theory. The main idea is to extend spectral clustering with rough set theory to obtain the results with lower-and-upper-approximation definition and between-cluster-overlapped structure. Experiment results indicate that the proposed algorithm outperforms the existing spectral clustering algorithms in both stability and accuracy.

作者郑吉苗夺谦王睿智钟才明

机构地区同济大学计算机科学与技术系

出处《计算机科学》 CSCD 北大核心 2009年第5期193-196,共4页 Computer Science

基金国家自然科学基金(60475019 60775036) 教育部博士点专项基金(20060247039)资助

关键词粗糙集谱聚类 K均值聚类 Rough set, Spectral clustering, K-means clustering

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1076
2Bach R,Jordan M L Learning spectral clustering[R].UCB/ CSD-03-1249.University of California at Berkeley,2003
3Hagen L,Kahng A B.New spectral methods for ratio cut partitioning and clustering[J].IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems,1992,11 (9):1074-1085
4Shi J,Malik J.Normalized cuts and image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22 (8):888-905
5Ding C H Q,He X,Zha H,et al.A rain-max cut algorithm for graph partitioning and data clustering[C] // Cercone N,Lin T Y,Wu X,eds.ICDM 2001.Los Alamitos,California:IEEE Computer Society,2001:107-114
6Lingras P,West C.Interval set clustering of web users with rough k-means[J].Journal of Intelligence Information Systems,2004,23(1):5-16
7Gu M,Zha H,Ding C,et al.Spectral relaxation models and structure analysis for k-way graph clustering and bi-clustering[R].CSE-01-007.Penn State University,2001
8Ng A Y,Jordan M I,Weiss Y.On spectral clustering:Analysis and an algorithm[C]//Dietterich T G,Becker S,Ghahramani Z,eds.Advances in Neural Information Processing Systems 14.Cambridge,MA:MIT Press,2002:849-856
9Peters G.Some refinements of rough k-means clustering[J].Pattern Recognition,2006,39:1481-1491
10UC Irvine Machine Learning Repository[DB/OL].URL:http://archive,ics.uci.edu/ml/

二级参考文献1

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114

共引文献1075

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：4
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献96

1刘岩,岳应娟,李言俊,张科.基于粗糙集的图像聚类分割方法研究[J].红外与激光工程,2004,33(3):300-302. 被引量：10
2伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
3李道国,苗夺谦,张红云.粒度计算的理论、模型与方法[J].复旦学报（自然科学版）,2004,43(5):837-841. 被引量：41
4钟茂生.WEB页面的模糊聚类[J].华东交通大学学报,2004,21(5):59-62. 被引量：2
5徐峰,张铃.基于商空间的非均匀粒度聚类分析[J].计算机工程,2005,31(3):26-28. 被引量：14
6徐峰,张铃,王伦文.基于商空间理论的模糊粒度计算方法[J].模式识别与人工智能,2004,17(4):424-429. 被引量：11
7何明,冯博琴,马兆丰,傅向华.基于熵和信息粒度的粗糙集聚类算法[J].西安交通大学学报,2005,39(4):343-346. 被引量：6
8朱树人,匡芳君,王艳华.基于粒度原理的蚁群聚类算法[J].计算机工程,2005,31(23):162-163. 被引量：6
9王伦文.聚类的粒度分析[J].计算机工程与应用,2006,42(5):29-31. 被引量：19
10李订芳,章文,何炎祥.一种新的带模糊权的粗糙聚类算法[J].信息与控制,2006,35(1):120-125. 被引量：3

引证文献4

1于洪,储双双.一种基于决策粗糙集的自动聚类方法[J].计算机科学,2011,38(1):221-224. 被引量：2
2徐丽,丁世飞.粒度聚类算法研究[J].计算机科学,2011,38(8):25-28. 被引量：11
3王伟,彭进业,刘盛辉.一种新的Vague集的协同过滤推荐算法[J].中国科技论文,2012,7(10):787-790.
4刘维.数据挖掘中聚类算法综述[J].江苏商论,2018(7):120-125. 被引量：19

二级引证文献32

1杨婷,郑雅玲,余帆,李应昆.基于CiteSpace对便秘研究的文献计量学及可视化分析[J].世界最新医学信息文摘,2019,19(76):51-54. 被引量：2
2周涛,陆惠玲.数据挖掘中聚类算法研究进展[J].计算机工程与应用,2012,48(12):100-111. 被引量：145
3王东波,朱丹浩.面向汉语句法功能分布知识库的词汇类别知识挖掘研究[J].现代图书情报技术,2013(3):33-37. 被引量：5
4王东波,朱丹浩.基于CABOSFV聚类算法的汉语词汇类别知识挖掘研究[J].计算机科学,2013,40(7):211-215. 被引量：1
5徐绪堪,郑昌兴,蒋勋.基于粒度原理的知识组织模型构建[J].图书与情报,2013(6):8-12. 被引量：10
6潘楚,罗可.基于改进粒计算的K-medoids聚类算法[J].计算机应用,2014,34(7):1997-2000. 被引量：11
7颜宏文,周雅梅,潘楚.基于宽度优先搜索的K-medoids聚类算法[J].计算机应用,2015,35(5):1302-1305. 被引量：5
8陈婷,郭凯,陈卫.基于非均匀粒度聚类的电子目标多传感器识别[J].无线电工程,2016(3):18-21.
9宋红海,颜宏文.基于优化粒计算下微粒子动态搜索的K-medoids聚类算法[J].智能计算机与应用,2016,6(2):9-13. 被引量：5
10郭晨晨,朱红康.基于MapReduce和并行遗传算法的大数据聚类问题研究[J].鲁东大学学报（自然科学版）,2017,33(1):31-35.

1韩宝如,林尔敏.离散小波变换在医学图像中的应用[J].电子测试,2016,27(8):39-40.
2梁俊杰,孙阳征.基于PH-Tree多属性索引树的朋友推荐算法[J].计算机科学,2015,42(4):156-159. 被引量：2
3郑吉.粗糙谱聚类在文本挖掘中的应用[J].电脑知识与技术,2009,5(3):1557-1558.
4杨世瀚,李婷婷.基于SVM的大学生热点问题的研究[J].电子制作,2016,24(5):89-92.
5甘玲,马艳春.基于sift特征描述符的多尺度图像配准方法[J].计算机仿真,2010,27(10):207-210. 被引量：4
6张玲,刘勇,何伟.自适应遗传算法在车牌定位中的应用[J].计算机应用,2008,28(1):184-186. 被引量：36
7李红莲,王春花,袁保宗.一种改进的支持向量机NN-SVM[J].计算机学报,2003,26(8):1015-1020. 被引量：71
8徐胤,乐珺,袁浩巍.基于不变矩特征和RBF神经网络的图像识别[J].上海电气技术,2015,8(3):33-36. 被引量：3
9蒋明,张桂林,陈其杰.具有学习功能的自动人脸识别[J].红外与激光工程,2001,30(4):178-182. 被引量：1
10李苹,王丽花,陶燕林.逻辑回归在学生综合素质量化评估中的应用[J].电脑知识与技术,2016,0(9):183-183.

计算机科学

2009年第5期

浏览历史

内容加载中请稍等...

一种基于粗糙集理论的谱聚类算法被引量：4

参考文献10

二级参考文献1

共引文献1075

同被引文献96

引证文献4

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

一种基于粗糙集理论的谱聚类算法 被引量：4

参考文献10

二级参考文献1

共引文献1075

同被引文献96

引证文献4

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

一种基于粗糙集理论的谱聚类算法被引量：4