摘要
对基于距离的聚类及基于密度的孤立点检测方法进行了分析研究,提出了一种基于距离和密度的聚类和孤立点检测算法DDBCOD。该算法根据距离和密度阈值对数据进行聚类,并发现数据中的孤立点。实验表明,该算法能够识别任意形状的聚类,对高维数据有效,能够很好地识别出孤立点。
Clustering and outlier detection methods are analyzed briefly.A distance density-based clustering and outlier detection algorithm(DDBCOD) is proposed.In it records the datum points by distance and density threshold,and identifies outliers by density threshold.As shown in the experimental results,the DDBCOD algorithm can cluster the dataset properly,it can discover clusters of arbitrary shapes,it is valid for high dimension dataset,and it can find outliers accurately and validly.
出处
《科学技术与工程》
2010年第22期5412-5416,共5页
Science Technology and Engineering
基金
河南省自然科学基金(0111051200)
河南省教育厅自然科学研究计划项目(2008B520016)资助
关键词
聚类分析
孤立点
距离
密度
clustering analysis outlier distance density