Hybrid:一种两阶段的聚类算法被引量：3

Hybrid: A Two Phase Clustering Algorithm

下载PDF

导出

摘要提出了一种两阶段的聚类方法:Hybrid。第一阶段产生大小相同的圆形原子聚类;第二阶段合并原子聚类形成任意形状和大小的聚合聚类。在扩展边界时,不但考虑原子聚类间的距离,还考虑原子聚类的密度相似度。这样可以更好地排除“噪音”的影响,得到内部结构更加趋同的聚合聚类。 This paper presents a new clustering algorithm named Hybrid. Hybrid involves two phases: the first phase generates a set of round atom clusters with same size, and the second phase merges these atom clusters to create a set of molecule clusters with arbitrary size and shape. During the edge expanding process, Hybrid considers not only the distance between two atom clusters, but also the closeness of two atom clusters' densities. Therefore Hybrid can eliminate outlier effectively while maintaining more isomorphic molecule clusters.

作者周兵沈钧毅彭勤科

机构地区东北大学秦皇岛分校计算机工程系西安交通大学电子与信息工程学院

出处《计算机工程》 EI CAS CSCD 北大核心 2005年第13期1-3,50,共4页 Computer Engineering

基金国家自然科学基金资助项目(60173058)

关键词数据挖掘聚类算法原子聚类聚合聚类噪音 Data mining Clustering algorithm Atom cluster Molecule cluster Outlier

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1Raymond T, Hau N J. Efficient and Effective Clustering Methods for Spatial Data Mining[A]. The 20^th VLDB Conference, Santiago, Chile,1994:144-155.
2Zhang Tian, Ramakrishnan R, Livny M. BIRCH: An Efficient Data Clustering Method for Very Large Databases[A]. Proceedings of the ACM SIGMOD Conference on Management of Data, Montreal,Canada, 1996:103-114.
3Ester M, Kriegel H P, Sander J, et al. A Density-based Algorithm for Discovering Clusters in large Spatial Database with Noise[A]. 2^nd Intl Conf on Knowledge Discovering in Databases and Data Mining,Portland, USA, 1996:226-231.
4Guha U, Rastogi R, Shim K. CURE: An Efficient Clustering Algorithm for Large Databases[J]. Pergamon Information Systems,2001, 26(1): 35-58.
5周兵,沈钧毅,彭勤科.基于随机抽样和聚类特征的聚类算法[J].西安交通大学学报,2003,37(12):1234-1237. 被引量：6
6Karypis G Han Eui—Hong(Sam),Kumar V.CHAMELEON:A Hierarchical Clustering Algorithm Using Dynamic Modeling.Computer,1999.32:68-75.

二级参考文献8

1[1]Raymond T, Hau N J. Efficient and effective clustering methods for spatial data mining[A]. The 20th VLDB Conference, Santiago, Chile, 1994.
2[2]Zhang T, Ramakrishnan R, Livny M. BIRCH: an efficient data clustering method for very large databases[A]. The ACM SIGMOD Conference on Management of Data, Montreal, Canada, 1996.
3[3]Ester M, Kriegel H P, Sander J, et al. A densitybased algorithm for discovering clusters in large spatial database with noise [A]. 2nd Intl Conf on Knowledge Discovering in Databases and Data Mining, Portland,USA, 1996.
4[4]Guha U,Rastogi R, Shim K. CURE.. an efficient clustering algorithm for large databases [J]. Pergamon Information Systems, 2001, 26(1): 35～58.
5[5]Wang Wei, Yang Jiong, Muntz R. STING: a statistical information grid approach to spatial data mining[A]. The 23rd VLDB Conference, Athens, Greece,1997.
6[6]Gehrke A J, Gunopulos D, Raghavan P. Automatic subspace clustering of high dimensional data for data mining applications [A]. The ACM SIGMOD International Conference on Management of Data, Seattle,USA, 1998.
7[7]Vitter J. Random sampling with reservoir [J]. ACM Trans on Mathematical Software, 1985, 11 (1): 37 ～57.
8[8]Motwani R, Raghavan P. Randomized algorithms [M]. London: Cambridge University Press, 1995.

共引文献5

1郑晓鸣,吕士颖,王晓东.一种基于随机抽取的有限深度层次聚类[J].郑州大学学报（理学版）,2007,39(3):80-83.
2宋殿霞,王艳,邹光辉.空间数据挖掘聚类算法研究[J].滨州学院学报,2006,22(6):43-48.
3周兵,冯中慧,王和兴.集群环境下的并行聚类算法之研究[J].计算机科学,2007,34(10):195-199. 被引量：2
4曹丹阳,杨炳儒,李广原,刘英华.一种基于CF树的k-medoids聚类算法[J].计算机应用研究,2011,28(9):3260-3263. 被引量：3
5吉成恒,雷咏梅.大规模数据集聚类的K邻近均匀抽样数据预处理算法[J].上海大学学报（自然科学版）,2016,22(1):28-35. 被引量：2

同被引文献13

1周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
2任永功,于戈.一种多维数据的聚类算法及其可视化研究[J].计算机学报,2005,28(11):1861-1865. 被引量：13
3樊建聪,梁永全,徐建国.基于一种可扩展函数族的聚类算法[J].计算机工程,2006,32(8):105-106. 被引量：2
4高能,冯登国,向继.一种基于数据挖掘的拒绝服务攻击检测技术[J].计算机学报,2006,29(6):944-951. 被引量：45
5李双虎,张风海.一个新的聚类有效性分析指标[J].计算机工程与设计,2007,28(8):1772-1774. 被引量：14
6J. MACQUEEN. Some methods for classification and analysis of multivariate observations[J]. Proc. 5th Berkeley Syrup. Math. Statist, 1967(1): 281--297.
7KDD99. KDD99 Cup dataset [DB/OL], 1999. http://ies. uci. edu/databases/kddcup99.
8谢艳玲,何丕廉,于鷃,孙越恒.一种高效的网页聚类方法[J].计算机工程与设计,2007,28(17):4229-4232. 被引量：7
9CHEN KEKE, LIU LING. iVIBRATE: Interactive visualizationbased framework for clustering large datasets[J]. ACM Transactions on Information Systems, 2006,24(2):245-294.
10Shantanu Dutt, Deng Wenyong. Cluster-aware iterative improvement techniques for partitioning large VLSI circuits[J]. ACM Transactions on Design Automation of Electronic Systems, 2002,7(1):287-293.

引证文献3

1李翠,吕林涛,白晓东.自构形网状聚类算法及应用研究[J].计算机工程与设计,2008,29(13):3448-3450.
2孙珊珊.聚类分析在入侵检测中的应用[J].河北省科学院学报,2010,27(3):31-34. 被引量：2
3王贞化,焦东杰.一种基于密度的无监督聚类算法[J].新乡学院学报,2010,27(6):53-56.

二级引证文献2

1马勇.一种改进的K-means聚类分析算法在医院信息系统中的应用研究[J].信息资源管理学报,2012,2(3):93-96. 被引量：1
2李丽,李宏伟,陈虎,戴弦.基于EM及熵值理论的区域经济与影响因素研究[J].地理空间信息,2012,10(5):60-63. 被引量：1

1孙挺,王华东,耿国华.基于字典学习和原子聚类的图像去噪算法[J].计算机应用研究,2016,33(7):2236-2240. 被引量：1
2刘必红,符红光.快速发现任意形状的聚类[J].计算机应用,2002,22(4):22-24. 被引量：3
3刘超.基于稀疏表示和聚类的快速超分辨率重建方法研究[J].南阳理工学院学报,2012,4(4):44-47.
4袁基炜,国辉.H.264编码器参考帧内存优化方法[J].电视技术,2007,31(8):15-17.
5曲伟.边界扫描测试在显示技术中的应用[J].指挥控制与仿真,2006,28(6):100-103.
6夏冬梅,李小冬.曲面拼接与扩展的三角剖分算法的改进[J].机械工程与自动化,2010(6):18-20. 被引量：1
7邓冬平.BGP在IPv6过渡阶段的应用[J].通信世界,2006(13B):6-6.
8姚远,刘媛媛,杨红飞,胡庆夕.三维封闭三角网格模型的缺失实体孔洞修复算法[J].机械工程学报,2009,45(6):154-159. 被引量：6
9单梁,杨刚,黄心渊.森林动态演替现象的可视化模拟[J].中国图象图形学报,2013,18(12):1666-1675. 被引量：7

计算机工程

2005年第13期

浏览历史

内容加载中请稍等...

Hybrid:一种两阶段的聚类算法被引量：3

参考文献6

二级参考文献8

共引文献5

同被引文献13

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Hybrid:一种两阶段的聚类算法 被引量：3

参考文献6

二级参考文献8

共引文献5

同被引文献13

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Hybrid:一种两阶段的聚类算法被引量：3