一种基于密度的快速聚类算法被引量：89

A FAST DENSITY BASED CLUSTERING ALGORITHM

下载PDF

导出

摘要聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了一种基于密度的快速聚类算法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 ,实现快速聚类 .对二维空间数据测试表明 :快速算法能够有效地对大规模数据库进行聚类 ,速度上数倍于已有 DBSCAN算法 . Clustering is a promising application area for many fields including data mining, statistical data analysis, pattern recognition, image processing, etc. In this paper, a fast density based clustering algorithm is developed, which considerably speeds up the original DBSCAN algorithm. Unlike DBSCAN, the new DBSCAN uses only a small number of representative objects in a core object's neighborhood as seeds to expand the cluster so that the execution frequency of region query can be decreased, and consequently the I/O cost is reduced. Experimental results show that the new algorithm is effective and efficient in clustering large scale databases, and it is faster than the original DBSCAN by several times.

作者周水庚周傲英曹晶胡运发

机构地区复旦大学计算机科学系

出处《计算机研究与发展》 EI CSCD 北大核心 2000年第11期1287-1292,共6页 Journal of Computer Research and Development

基金国家自然科学基金项目!(项目编号 6 97430 0 1) 国家教委博士点教育基金

关键词数据挖掘聚类密度快速算法数据库 spatial database, data mining, clustering, density, fast algorithm, representative objects

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1Zhang W，Proc 23rd VL DB Conf，1997年，186页
2Chen M S，IEEE Trans Knowledge Data Engineering，1996年，8卷，6期，866页
3Zhang T，Proc ACM SIGMOD Int Conf on Management of Data，1996年，73页
4Ng R T，Proc 20th VLDB Conf，1994年，144页

同被引文献699

1陈丽琴.基于5G系统的长期波束赋形的性能研究[J].电信快报,2021(10):15-18. 被引量：1
2湛东升,张文忠,张娟锋,李佳洺,谌丽,党云晓.北京市公共服务设施集聚中心识别分析[J].地理研究,2020,0(3):554-569. 被引量：30
3刘繁明,屈昊.ICP算法的鲁棒性改进[J].仪器仪表学报,2004,25(z1):603-605. 被引量：5
4张京祥.全球化背景中的区域发展与规划转变[J].国外城市规划,2004,19(3):1-4. 被引量：37
5成睿奇,田盛丰,黄厚宽.基于分布式智能代理的入侵检测方法研究[J].计算机工程与设计,2004,25(3):374-378. 被引量：2
6李元臣,刘维群.基于Dijkstra算法的网络最短路径分析[J].微计算机应用,2004,25(3):295-298. 被引量：70
7周永权,焦李成.高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J].电子学报,2004,32(8):1342-1345. 被引量：3
8张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
9宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
10金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161

引证文献89

1梁敏君,倪志伟,倪丽萍,杨葛钟啸.基于网格与分形维数的聚类算法[J].计算机应用,2009,29(3):830-832. 被引量：4
2周文勇.改进的K-均值聚类算法[J].光盘技术,2007(2):54-56. 被引量：6
3王海,王忠民.一种基于密度和网格的聚类算法在KDD中的应用[J].计算机工程与应用,2004,40(24):180-182. 被引量：3
4周永权,焦李成.高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J].电子学报,2004,32(8):1342-1345. 被引量：3
5林小红,蒋伟进.基于RS近似算法的医疗诊断知识挖掘[J].海军工程大学学报,2004,16(5):48-51.
6薛永生,翁伟,文娟,王劲波,张宇.LSNCCP——一种基于最大不相含核心点集的聚类算法[J].计算机研究与发展,2004,41(11):1930-1935. 被引量：2
7郭伟,唐晓君,刘万军.一种基于划分的聚类算法分析与改进[J].辽宁工程技术大学学报（自然科学版）,2004,23(6):826-828. 被引量：4
8万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16
9郭俊,樊彦国.一种改进的CURE聚类算法[J].内蒙古石油化工,2005,31(4):14-17.
10石陆魁,何丕廉.一种基于密度的高效聚类算法[J].计算机应用,2005,25(8):1824-1826. 被引量：21

二级引证文献649

1曾子涵.基于贝叶斯网络的交通拥堵实时预测[J].冶金管理,2019,0(21):24-24.
2杨然,王虹,孙传波,余国才.基于因子图优化的DBSCAN聚类组合导航算法[J].微波学报,2023,39(S01):409-413.
3宗长富,文龙,何磊.基于欧几里得聚类算法的三维激光雷达障碍物检测技术[J].吉林大学学报（工学版）,2020,50(1):107-113. 被引量：24
4聂辰辰,程峰,王成,王金亮,吴骏恩.地面激光雷达点云数据乔灌分离方法研究[J].测绘科学,2024,49(1):106-116.
5吕佳,熊浩.一种新城市气温模式分类的聚类算法[J].数学的实践与认识,2007,37(8):55-60.
6毕方明,张虹,曹天杰.非均匀Hilbert曲线的生成算法[J].中国矿业大学学报,2009,38(5):729-734. 被引量：3
7柳永念,郭会林.对C均值聚类算法的一些改进[J].广西大学学报（哲学社会科学版）,2007,29(S3):207-208.
8吴晓璇,倪志伟,倪丽萍.基于分形维数的聚类融合算法[J].吉林大学学报（工学版）,2012,42(S1):364-367. 被引量：1
9徐德俊.数据挖掘技术在图书馆管理信息系统中的应用[J].黑龙江史志,2015(5):266-266. 被引量：6
10贾泽露,刘耀林,张彤.GIS与可视化SDM技术集成问题探讨[J].南京师范大学学报（工程技术版）,2004,4(4):37-42. 被引量：8

1王晓帆,王宝树,柴慧敏.一种基于属性-值树的求核与约简方法[J].西安电子科技大学学报,2010,37(6):1111-1118. 被引量：2
2罗春晔.知识表达与超文本[J].广西科学,1995,2(3):8-11.
3沈洁,赵雷,杨季文,李榕.一种基于划分的层次聚类算法[J].计算机工程与应用,2007,43(31):175-177. 被引量：13
4周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
5陈德望 ,林柏梁 .国家重点实验室统计数据分析[J].实验技术与管理,2005,22(6):100-104. 被引量：4
6华奇兵,许文波,费娜.面向对象软件重构[J].重庆邮电学院学报（自然科学版）,2004,16(2):96-100. 被引量：3
7张乔,尹俊文,许世平.面向对象软件质量度量的研究与应用[J].科技信息,2009(30). 被引量：1
8许文波,华奇兵,费娜.面向对象的软件重构[J].计算机工程,2005,31(5):82-84. 被引量：9
9孙凌燕,杨明.一种基于密度的快速聚类算法的改进[J].太原师范学院学报（自然科学版）,2008,7(4):5-7.
10曾泽林,段明秀.基于密度的聚类算法DBSCAN的研究与实现[J].科技信息,2012(30):163-163. 被引量：3

计算机研究与发展

2000年第11期

浏览历史

内容加载中请稍等...

一种基于密度的快速聚类算法被引量：89

参考文献4

同被引文献699

引证文献89

二级引证文献649

相关作者

相关机构

相关主题

浏览历史

一种基于密度的快速聚类算法 被引量：89

参考文献4

同被引文献699

引证文献89

二级引证文献649

相关作者

相关机构

相关主题

浏览历史

一种基于密度的快速聚类算法被引量：89