基于聚类和LOF算法的异常数据检测方法
被引量:5
摘要
聚类可用于异常检测,但其检查结果往往是不精准的.首先通过聚类算法DBSCAN对数据进行异常分析,然后再利用LOF算法对检出的异常数据进行异常程度的分析,最终得出异常数据集.
出处
《伊犁师范学院学报(自然科学版)》
2011年第2期48-50,共3页
Journal of Yili Normal University:Natural Science Edition
参考文献6
-
1D.Hawkins. Identification of Outliers[M]. London: Chapman and Hall, 1980.
-
2黄添强,秦小麟,叶飞跃.基于方形邻域的离群点查找新方法[J].控制与决策,2006,21(5):541-545. 被引量:16
-
3M Breunig, Hans-Peter Kriegel, et al. LOF: Identifying density-based local outliers[R]. The ACM SIGM OD 2000 Int'l Confon Management of Data, Dalles, TX, 2000.
-
4杨风召,朱扬勇,施伯乐.IncLOF:动态环境下局部异常的增量挖掘算法[J].计算机研究与发展,2004,41(3):477-484. 被引量:33
-
5谭庆,张瑞玲.基于局部偏离因子的孤立点检测算法[J].计算机工程,2008,34(17):59-61. 被引量:5
-
6张晓.基于密度聚类算法的异常检测[J].伊犁师范学院学报(自然科学版),2010,4(4):52-54. 被引量:6
二级参考文献35
-
1J.Han,M.Kamber.数据挖掘:概念与技术[M].北京:机械工业出版社,2000.
-
2Pang-Ning Tan, Michael Steinbach, Vipin Kumar,编.范明,范宏建,译.数据挖掘导论[M].北京:人民邮电出版社,2006.
-
3D.Hawkins. Identification of Outliers[M]. London: Chapman and Hall, 1980.
-
4D Hawkins. Identification of Outliers. London: Chapman and Hall, 1980
-
5V Barnett, T Lewis. Outliers in Statistical Data. New York: John Wiley, 1994
-
6E Knorr, R Ng. Algorithms for mining distance-based outliers in large data sets. The 24th Int'l Conf on Very Large Data Bases. New York, 1998
-
7S Ramaswamy, R Rastogi, K Shim. Efficient algorithms for mining outliers from large data sets. The ACM SIGMOD 2000 Int'l Conf on Management of Data, Dalles, TX, 2000
-
8R Agrawal, P Ragaran. A linear method for deviation detection in large databases. In: Proc of the 2nd Int'l Conf on Knowledge Discovery and Data Mining. Portland, OR: AAAI Press, 1996. 164~169
-
9M Breunig, Hans-Peter Kriegel, R Ng et al. LOF: Identifying density-based local outliers. The ACM SIGMOD 2000 Int'l Conf on Management of Data, Dalles, TX, 2000
-
10M Ester, Hans-Peter Kriegel, J Sander et al. Incremental clustering for mining in a data warehousing environment. The 24th Int'l Conf on Very Large Data Bases, New York, 1998
共引文献52
-
1蒋盛益,李庆华,王卉,孟中楼.一种增强的局部异常挖掘方法[J].计算机研究与发展,2005,42(2):210-216. 被引量:8
-
2黄洪宇,林甲祥,陈崇成,樊明辉.离群数据挖掘综述[J].计算机应用研究,2006,23(8):8-13. 被引量:42
-
3林甲祥,刘丰富.基于MST聚类的离群检测算法研究[J].福建电脑,2007,23(9):1-2.
-
4张应辉,饶云波.最小差异度聚类在异常入侵检测中的应用[J].计算机应用研究,2007,24(12):193-195. 被引量:1
-
5涂溢彬,饶云波,廖云,周明天.蜜网系统在检测新型Rootkit中的应用[J].计算机技术与发展,2008,18(1):181-184.
-
6李健,阎保平,李俊.基于记忆效应的局部异常检测算法[J].计算机工程,2008,34(12):4-6. 被引量:8
-
7陶运信,皮德常.基于邻域和密度的异常点检测算法[J].吉林大学学报(信息科学版),2008,26(4):398-403. 被引量:12
-
8王津,饶云波.基于SVM汽车牌照识别技术研究[J].福建电脑,2008,24(9):125-126.
-
9陶运信,皮德常.屏蔽输入参数敏感的异常点检测新方法[J].计算机科学,2008,35(12):192-195. 被引量:2
-
10张宁.基于滑动窗口的时间序列离群数据挖掘[J].燕山大学学报,2008,32(6):483-486. 被引量:2
同被引文献46
-
1芮挺 ,沈春林 ,TIAN Qi ,丁健 .ICA与PCA特征抽取能力的比较分析[J].模式识别与人工智能,2005,18(1):124-128. 被引量:8
-
2Q/GDW 373-2009,电力用户用电信息采集系统功能规范[S].
-
3V Chandola, A Banerjee, V Kumar. Anomaly de-tection: A sur- vey[J]. ACM Computing Surveys,2009, 41(3) : 1-58.
-
4S Hido, Y Tsuboi, H Kashima, et al, Statistical outlier detection using direct density ratio estimation [ J ]. Knowledge and Informa-tion Systems, 2011, 26 (2) : 309-336.
-
5Solberg, H E and Lahti A. Detection of outliers in reference distri- butions : performance of Horn's al-gorithm [ J ]. Clinical chemistry, 2005, 15(12) : 2326-2332.
-
6M Breunig, H Kriegel, R Ng, et al. Lof: identifying density-based local outliers[J]. Sig-mod Record, 2000, 29(2) : 93-104.
-
7M Wainwright, T Jaakkola, A Willsky, et al. Map estimation via agreement on trees: message-passing and linear programming[ J]. IEEE Transactions on Information Theory, 2005, 51 ( 11 ) : 3697- 3717.
-
8A Frank, A Asuncion,et al. UCI machine learning repository[ C ]. 2010.
-
9Q/GDW 354-2012,智能电能表功能规范[S].
-
10Song Siyang. Research on electricity consumption information collec- tion system building in the electric power marketing [ D]. Beijing: North China Electric Power University, 2011.
引证文献5
-
1高恩阳,刘伟军,王天然.一种基于线性规划的孤立点检测方法[J].控制工程,2013,20(6):1123-1126. 被引量:2
-
2李亦非,宋玮琼,彭放,丁宁,王芳.基于局部异常点检测算法的电能表飞走异常智能分析[J].电测与仪表,2016,53(18):69-73. 被引量:9
-
3孙智超,王波.基于数据挖掘技术的建筑能耗分析集成方法[J].计算机应用与软件,2017,34(11):103-108. 被引量:2
-
4郭屾,林佳颖,王鹏,张冀川,陈蕾,唐国静.基于ROF离群组检测的低压配电网拓扑校验[J].控制工程,2020,27(1):201-206. 被引量:8
-
5刘军,魏敏,陈克锐,艾勇,姚剑平.基于离群点检测的风电机组偏航频繁检测[J].能源研究与管理,2020(3):52-58. 被引量:3
二级引证文献24
-
1徐鹤,曹彬,王俊峰,岳文彦,杨宇凡.风电机组对风不准识别算法研究与应用[J].环境工程,2023,41(S02):982-986. 被引量:1
-
2朱泽民,肖飞.基于满意度及特征近似的协同数据融合推荐[J].控制工程,2017,24(5):1013-1019. 被引量:4
-
3周明杰,缪慧玲.大数据时代基于孤立点分析的审计抽样方法探讨[J].中国管理信息化,2017,20(12):35-36. 被引量:7
-
4李小玲.关于网络数据库传输中异常数据检测仿真研究[J].计算机仿真,2018,35(1):420-423. 被引量:7
-
5蔡耀年,王明琪,刘建森,赵陆军,李贤靓.一种基于离群算法的窃电行为检测的研究[J].计算技术与自动化,2018,37(2):73-77. 被引量:3
-
6李宁,尹小明,丁学峰,蔡慧,汪伟.一种融合聚类和异常点检测算法的窃电辨识方法[J].电测与仪表,2018,55(21):19-24. 被引量:20
-
7张珣,王雪永.基于AI的写字楼能耗分析系统设计[J].软件导刊,2019,18(4):104-107. 被引量:1
-
8赵磊.多链路即时通信中交互数据异常点检测仿真[J].计算机仿真,2019,36(11):445-448. 被引量:3
-
9梁捷,梁广明.基于ARMA和K-means聚类的用电量数据异常识别[J].湖北电力,2019,43(4):65-70. 被引量:4
-
10樊辉,李进明.基于控制图的有轨电车能耗分析方法研究[J].信息技术与网络安全,2020,39(1):92-99. 被引量:1
-
1吕奔,高茂庭.基于密度的孤立点检测算法改进研究[J].现代计算机(中旬刊),2015(6):62-67. 被引量:5
-
2尹敏杰,东春昭.一种改进的K-means聚类算法与孤立点检测研究[J].电脑知识与技术,2010,6(7X):6085-6086.
-
3应磊,王儒敬,杨紫微,苏雅茹.异常农产品价格数据的检测[J].计算机系统应用,2010,19(4):178-180. 被引量:2
-
4毛伊敏,杨路明,陈志刚,刘立新.基于数据流挖掘技术的入侵检测模型与算法[J].中南大学学报(自然科学版),2011,42(9):2720-2728. 被引量:6
-
5王敬华,赵新想,张国燕,刘建银.NLOF:一种新的基于密度的局部离群点检测算法[J].计算机科学,2013,40(8):181-185. 被引量:28
-
6张净,孙志挥,杨明,倪巍伟,杨宜东.基于网格和密度的海量数据增量式离群点挖掘算法[J].计算机研究与发展,2011,48(5):823-830. 被引量:8
-
7刘琰.基于BCP异常数据检测方法的应用与研究[J].西安航空技术高等专科学校学报,2012,30(3):74-76.
-
8徐雪松.时间序列不确定数据流中异常数据检测方法[J].电子设计工程,2011,19(19):19-21. 被引量:2
-
9邓曦辉.软件工程领域中的异常数据挖掘算法[J].电子技术与软件工程,2016(24):188-188. 被引量:2
-
10许琳,赵茂先.基于密度的局部离群数据挖掘算法研究[J].山东理工大学学报(自然科学版),2016,30(6):7-11. 被引量:2