基于遗传聚类算法的离群点检测被引量：1

Outlier detection based on genetic algorithm for clustering

下载PDF

导出

摘要离群点检测是数据挖掘一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法。对离群数据挖掘几类主要的方法进行了分析和评价,并在此基础上了提出了一种基于遗传聚类的离群点检测算法。该算法结合了遗传算法全局搜索的优点和K-均值方法局部收敛速度快的特点,取得较好效果。实验验证该算法很好地检测到数据集中的离群点,同时还完成了数据集的聚类。具有较好的实用性。 Outlier detection, as an important aspect of data mining, provides a new method for analyzing various quantitative,complex and noisy data.In this paper,authors analyze and evaluate several major methods of the outlier data mining,and propose a new outlier detection algorithm which is based on an genetic algorithm for clustering.By integrating with global searching of the genetic algorithm and the good local convergence rate of the K-means algorithm,this algorithm gets a better result.Experiments show that this algorithm not only can detect the outliers in the dataset,but also complete the clustering of the dataset.So it has a good practicality.

作者钱光超贾瑞玉张然李龙澍

机构地区安徽大学计算机科学与技术学院

出处《计算机工程与应用》 CSCD 北大核心 2008年第11期155-157,共3页 Computer Engineering and Applications

基金安徽省教育厅资助科研课题(the Research Project of Department of Education of Anhui Province China under Grant No.2005KJ056)

关键词离群点检测数据挖掘遗传算法聚类 K-均值算法 outlier detection data mining genetic algorithm clustering K-means algorithm

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1Tan P N,Steinbach M,Kumar V.Introduction to data mining[M].北京:人民邮电出版社,2006.
2Han Jiawei,Micheline Kamber.Data mining:Concepts and techniques[M].北京:机械工业出版社,2001.
3Maiywan S.Kashyap R L.A cluster based approach to robust regression and outlier detection[C]//Proceedings of 1994 IEEE International Conference on Systems,Man and Cybernetics.New York: IEEE, 1994,3 : 2561-2565.
4Ali A,Antonio G E.Bad data identification when using ampere measurements[J].IEEE Trans on Power System, 1997,12(2) :831-837.
5Maulik U,Bandyopadhyay S.Genetic algorithm-based clustering technique[J].Pattem Recognition, 2000,33 (9) : 1455-1465.

共引文献2

1葛从兵,李雷.小型水库溃坝预测专家系统设计与实现[J].计算机工程与设计,2008,29(11):2918-2919. 被引量：2
2钱光超,贾瑞玉,张然,李龙澍.Apriori算法的一种优化方法[J].计算机工程,2008,34(23):196-198. 被引量：47

同被引文献14

1蒋亮,李书明,郝英,白杰,郝红勋.航空发动机气路故障诊断研究现状[J].中国民航大学学报,2005,23(z1):60-62. 被引量：6
2吕林涛,王鹏,李军怀,吕晖,张景.基于时间序列的趋势性分析及其预测算法研究[J].计算机工程与应用,2004,40(19):172-174. 被引量：18
3曲文龙,樊广佺,杨炳儒.基于支持向量机的复杂时间序列预测研究[J].计算机工程,2005,31(23):1-3. 被引量：32
4徐雪松,刘凤玉.一种基于距离的再聚类的离群数据发现算法[J].计算机应用,2006,26(10):2398-2400. 被引量：4
5薛安荣,鞠时光,何伟华,陈伟鹤.局部离群点挖掘算法研究[J].计算机学报,2007,30(8):1455-1463. 被引量：96
6王旭辉,黄圣国,曹力,施鼎豪,舒平.基于LS-SVM的航空发动机气路参数趋势在线预测[J].吉林大学学报（工学版）,2008,38(1):239-244. 被引量：16
7张昌义,戴文战.基于二次指数平滑的BP神经网络模型研究及应用[J].浙江理工大学学报（自然科学版）,2008,25(4):442-445. 被引量：1
8徐翔,刘建伟,罗雄麟.离群点挖掘研究[J].计算机应用研究,2009,26(1):34-40. 被引量：27
9林兆福,范作民,孙春林.航空发动机气动热力参数的趋势分析[J].中国民航大学学报,1989,22(4):1-9. 被引量：4
10王佰兴.基于小波分析的数据平滑处理算法研究与应用[J].科技创新导报,2009,6(31):142-142. 被引量：8

引证文献1

1钟诗胜,崔智全,付旭云,王体春.航空发动机气路参数偏差值平滑处理技术[J].计算机集成制造系统,2013,19(6):1199-1204. 被引量：1

二级引证文献1

1曹惠玲,张卓.多平滑指标融合的气路参数平滑评判方法研究[J].中国民航大学学报,2016,34(3):17-21.

1蔡江辉,张继福.基于聚类的离群数据挖掘及应用[J].太原重型机械学院学报,2004,25(4):254-258. 被引量：2
2王丹,毛紫阳,吴孟达.融合Shadowed Sets聚类的离群点检测算法[J].计算机科学与探索,2012,6(11):985-993. 被引量：3
3程艳,苗永春.高维数据流的聚类离群点检测算法研究[J].江西师范大学学报（自然科学版）,2014,38(5):449-453. 被引量：2
4古平,刘海波,罗志恒.一种基于多重聚类的离群点检测算法[J].计算机应用研究,2013,30(3):751-753. 被引量：21
5杨维永,何军,郑生军,张旭东.一种适宜于子空间聚类的离群点检测算法[J].计算机与现代化,2015(12):39-42. 被引量：2
6闫伟,张浩,陆剑峰.一种离群数据挖掘新方法的研究与应用[J].控制与决策,2006,21(5):563-566. 被引量：5
7陈庄,黄勇,邹航.基于离群点挖掘的工业控制系统异常检测[J].计算机科学,2014,41(5):178-181. 被引量：13
8姚鹏,古平.一种基于多视角聚类的离群检测算法[J].现代计算机（中旬刊）,2016(5):43-47.
9徐雪松,刘凤玉.一种基于距离的再聚类的离群数据发现算法[J].计算机应用,2006,26(10):2398-2400. 被引量：4
10朱庆生,钟洵,杨鹏.NJW在离群数据挖掘中的应用研究[J].计算机工程与应用,2010,46(7):128-130. 被引量：4

计算机工程与应用

2008年第11期

浏览历史

内容加载中请稍等...

基于遗传聚类算法的离群点检测被引量：1

参考文献5

共引文献2

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于遗传聚类算法的离群点检测 被引量：1

参考文献5

共引文献2

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于遗传聚类算法的离群点检测被引量：1