非均匀类簇密度聚类的多粒度自学习算法被引量：4

Multi-granularity self-learning clustering algorithm for non-uniform cluster density

下载PDF

导出

摘要针对非均匀类簇密度聚类问题,从商空间粒度理论出发,提出一种多粒度自学习聚类算法(multi-granularity self-learning clustering algorithm,MSCA)。算法通过构造聚合树结构和定义粒度函数对问题逐层求解,并在每层聚合过程中根据聚合区间以自学习的方式动态确定聚合粒度,解决了传统聚类算法从非均匀类簇密度数据中无法得到不同层次的聚合特征且参数对经验依赖性过高的问题。理论和实验表明,MSCA算法可以发现任意形状类簇,有效处理噪声,并能发现关键聚合层,具有较好的计算复杂性。 Based on the quotient space granularity theory,a multi-granularity self-learning clustering algorithm（MSCA） is presented for problems with non-uniform cluster density.By constructing a feature clustering tree and defining a granularity function,MSCA solves problems layer by layer and learns clustering granularity dynamically by itself in each step.Traditional clustering algorithms with global parameters cannot discover data features in various layers,and their parameters depend on professional experience seriously,while MSCA can overcome these defects.Both theory analysis and experimental results show that MSCA can discover key clustering layers and clusters with arbitrary shape.Furthermore,it is insensitive to noise and has a satisfactory computing complexity.

作者曾华吴耀华黄顺亮

机构地区山东大学控制科学与工程学院山东大学现代物流研究中心山东理工大学管理学院

出处《系统工程与电子技术》 EI CSCD 北大核心 2010年第8期1760-1765,共6页 Systems Engineering and Electronics

基金国家自然科学基金(50175064)资助课题

关键词数据挖掘聚类算法非均匀类簇密度聚类粒度计算自学习算法 data mining clustering algorithm clustering with non-uniform cluster density granular computing self-learning algorithm

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1074
2MacQueen J.Some methods for classification and analysis of multivariate observations[C]// Proc.of the 5th Berkeley Symposium on Mathematics Statistic Problem,1967:281-297.
3Ester M,Kriegel H P,Sander J,et al.A density-based algorithm for discovering clusters in large spatial databases with noise[C]// Proc.of the Second International Conference on Knowledge Discovery and Data Mining,1996:226-231.
4Hinneburg A,Keim D.An efficient approach to clustering in large multimedia databases with noise[C]// Proc.of the 4th International Conference on Knowledge Discovery and Data Mining,1998:58-65.
5Zhang T,Ramakrishnan R,Livny M.BIRCH:an efficient data clustering method for very large databases[C]// Proc.of the ACM SIGMOD,1996:103-114.
6Guha S,Rastogi R,Shim K.CURE:an efficient clustering algorithm for large databases[C]// Proc.of the ACM SIGMOD International Conference on Management of Data,1998:73-84.
7Bezdek J C,Hathaway R J.Numerical convergence and interpretation of the fuzzy c-shells clustering algorithm[J].IEEE Trans.on Neural Networks,1992,3(5):787-793.
8Tari L,Baral C,Kim S.Fuzzy c-means clustering with prior biological knowledge[J].Journal of Biomedical Informatics,2009,42(1):74-81.
9唐旭清,朱平,程家兴.基于模糊商空间的聚类分析方法(英文)[J].软件学报,2008,19(4):861-868. 被引量：17
10赵恒,杨万海.基于属性加权的模糊K-Modes聚类算法[J].系统工程与电子技术,2003,25(10):1299-1302. 被引量：12

二级参考文献21

1王宏伟,马广富.基于模糊模型的混沌时间序列预测[J].物理学报,2004,53(10):3293-3297. 被引量：21
2谭文,王耀南.不确定混沌系统的直接自适应模糊神经网络控制[J].物理学报,2004,53(12):4087-4091. 被引量：12
3李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
4刘福才,孙立萍,梁晓明.基于递阶模糊聚类的混沌时间序列预测[J].物理学报,2006,55(7):3302-3306. 被引量：8
5高新波姬红兵.一种基于特征加权的模糊C-均值聚类算法[J].西安电子科技大学学报,2000,27(10):80-83.
6陈述彭鲁学军周成虎.地理信息导论[M].北京:科学出版社,1999..
7Tung A K H, HOU J, Han J. Spatial clustering in the presence of obstacle[A]. Proc 2001 Int. Conf. On Data Engineering ICDE(01) [C], 2001,359- 367.
8钱颂迪.等运筹学[M].北京:清华大学出版社,1990..
9HanJiawei MichelineKambe.数据挖掘概念与技术[M].北京：机械工业出版社,2001..
10Gomez-Skarmeta A F, Delgado M, Vila M A. About the use of fuzzy clustering techniques for fuzzy model identification [J]. Fuzzy Sets and Systems, 1999,106(2) : 179 - 188.

共引文献1299

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献44

1王刚,魏凤,张智文.RFID在物流中的应用[J].管理现代化,2006,26(4):4-6. 被引量：16
2贺玲,吴玲达,蔡益朝.高维空间中数据的相似性度量[J].数学的实践与认识,2006,36(9):189-194. 被引量：20
3Pilevar A H, Sukumar M. GCHL.. a grid-clustering algorithm for high-dimensional very large spatial data base[J]. Pattern Recognition Letters ,2005,26(7) :999 - 1010.
4Cheeseman P, Stutz J. Bayesian classification (AutoClass) theory and results. In advances in knowledge discovery and data mining[M]. AAAI/MIT Press,1996:61 - 83.
5Preston D R, Brodley C E, Khardon R, et al. Redefining class definitions using constraint-based clustering[C]// Proc. of the 16th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 2010: 823 - 832.
6Liu N, Zhang B Y, Yan J, et al. Learning similarity measures in the nonorthogonal space[C] // Proc. of the 13th Conference on Information and Knowledge Management, 200: 334 - 341.
7B6hm C, Plant C, Shao J M, et al. Clustering by synchronization[C]// Proc. of the 16th ACM S IGKDD Conference on Knowledge Discovery and Data Mining, 2010:583 - 592.
8Karypis G, Han E H, Kumar V. CHAMELEON: a hierarchical clustering algorithm using dynamic modeling [ J]. Computer, 1999,32(2) :68 -75.
9Kumar P, Krishna P R, Bapi R S, et al. Rough clustering of sequential data[J]. Data &Knowledge Engineering, 2007, 3 (2) :183- 199.
10NGR T, Han J W. CLARANS: a method for clustering objects for spatial data mining[J]. IEEE Trans. on Knowledge and Data Engineering ,2002,14(5) :1003 - 1015.

引证文献4

1石崇林,张茂军,吴琳,唐宇波,景民.基于密度的计算机兵棋推演数据快速聚类算法[J].系统工程与电子技术,2011,33(11):2428-2433. 被引量：4
2刘明术,方宏彬,张建,孙启林.属性相似度在聚类算法中的有效性研究[J].计算机应用与软件,2012,29(9):146-147. 被引量：4
3戴俊源,阎应红,王朋.基于物联网的成品油二次配送系统设计[J].炼油与化工,2013,24(1):27-30. 被引量：2
4周红芳,刘园,谈姝辰.基于商空间理论的K-means改进算法[J].西安理工大学学报,2013,29(4):400-405. 被引量：1

二级引证文献11

1曹志朋,胡晓峰,曹占广,石崇林.兵棋推演联合作战计划路径冲突校验算法研究[J].计算机仿真,2013,30(3):1-4. 被引量：1
2陈刚,顾丹.基于相似度的总装作业集划分方法研究[J].机械设计与制造工程,2014,43(1):69-72.
3于本成,鲍宇,曹天杰,朱作付.面向大型数据集的聚类算法的优化与融合[J].计算机工程与设计,2014,35(5):1651-1655.
4董军佩,李海洋.药品电子交易公共平台功能评价研究[J].企业技术开发（下旬刊）,2014,33(4):73-75.
5李敏,黄强,倪少权,邱小平.基于上下文感知的成品油配送物联网架构设计[J].物流技术,2014,33(6):336-340. 被引量：2
6张屹,潘正军.基于多切片最优融合集的故障测试约束构造方法[J].计算机工程与应用,2014,50(20):264-270.
7柳玉,文家焱,陈建华.计算机兵棋系统发展及应用研究[J].兵工自动化,2015,34(8):20-26. 被引量：10
8蔡昌许.一种基于连通性的聚类有效性评价指标[J].计算机应用与软件,2015,32(11):285-288. 被引量：1
9张会敏,谢泽奇,张善文.基于改进k-means算法的猕猴桃叶部病斑分割方法[J].电脑知识与技术,2020,16(25):19-21. 被引量：2
10吴蕾,邓海冰,伍文峰.面向兵棋演习的作战过程描述辅助生成方法[J].指挥信息系统与技术,2022,13(2):25-30.

1文贵华,向君,丁月华.基于商空间粒度理论的大规模SVM分类算法[J].计算机应用研究,2008,25(8):2299-2301. 被引量：8
2王作飞,昝红英.一种改进的基于粗糙集理论的特征选取方法[J].微计算机信息,2012,28(3):150-152.
3Qin Xiao & Pang Liping(Department of Computer Science, Huazhong University of Science and Technology,Wuhan 430074, P. R. China).CRF:A Scheduling of Multi-Granularity Locks in Object-Oriented Database Systems[J].Journal of Systems Engineering and Electronics,1998,9(4):51-57.
4鲁斌,赵晓敏,靳然然.基于商空间的模糊聚类方法研究[J].微计算机信息,2010,26(3):8-10. 被引量：2
5黄剑韬.基于商空间的向量空间模型文本分类方法[J].计算机应用,2011,31(A02):67-69. 被引量：5
6朱扬勇,熊贇.大数据的若干基础研究方向[J].大数据,2017,3(2):104-114. 被引量：2
7高正龙,吴涛,陈小波,杨莹莹.图像滤波的商空间粒计算算法[J].计算机工程与应用,2013,49(24):182-185. 被引量：1
8吴静,彭珍,席振元,田立勤.基于MANET的稳定分群算法研究[J].计算机应用与软件,2013,30(11):102-105.
9杨清宇,孙凤伟,张曌,张迪,庄健.利用测地线距离的改进谱聚类算法[J].西安交通大学学报,2012,46(8):1-7. 被引量：5
10罗伯特.麦克法兰,申.米尔索姆威克,严诗恬,胡安娣.现代高密度数据中心高效供电和散热的研究策略[J].智能建筑电气技术,2012,6(5):77-78.

系统工程与电子技术

2010年第8期

浏览历史

内容加载中请稍等...

非均匀类簇密度聚类的多粒度自学习算法被引量：4

参考文献14

二级参考文献21

共引文献1299

同被引文献44

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

非均匀类簇密度聚类的多粒度自学习算法 被引量：4

参考文献14

二级参考文献21

共引文献1299

同被引文献44

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

非均匀类簇密度聚类的多粒度自学习算法被引量：4