基于核密度波动的异常检测算法被引量：4

Anomaly Detection Algorithm Based on Kernel Density Fluctuation

下载PDF

导出

摘要异常检测是数据挖掘中的一个重要研究方向,当前大多数基于密度的异常检测算法常常基于样本分布假设,敏感于近邻参数k并且缺乏对集体异常点的检测能力。针对这些问题,提出了一种基于核密度估计的核密度波动算法。定义了可以综合评估数据点邻域内和邻域外核密度值波动的核密度波动因子,将其作为检测指标,并制定检测规则来识别异常点,这一指标可以综合考虑数据点的局部特征和全局特征,而且有助于发现集体异常。数据集上的实验结果表明,所提算法可以取得更好的检测结果,同时对算法参数具有相当的鲁棒性。 Anomaly detection is an important research direction in data mining.Most current density-based algorithms are often based on sample distribution assumptions,are sensitive to the nearest neighbor parameter k,and cannot detect collective outliers.Aiming at these problems,a kernel density fluctuation algorithm based on kernel density estimation is proposed.The kernel density fluctuation factors that can comprehensively evaluate the fluctuations of nuclear density val-ues within and outside the neighborhood are defined,and detection criteria are developed to identify outliers.This indica-tor can comprehensively consider the local and global characteristics of the data points,and at the same time help to find collective anomalies.The experimental results on the data set show that the proposed algorithm can achieve better detec-tion results,and at the same time,it is quite robust to the algorithm parameters.

作者张博文刘智桑国明 ZHANG Bowen;LIU Zhi;SANG Guoming(Information Science and Technology College,Dalian Maritime University,Dalian,Liaoning 116026,China)

机构地区大连海事大学信息科学技术学院

出处《计算机工程与应用》 CSCD 北大核心 2021年第12期132-136,共5页 Computer Engineering and Applications

基金国家自然科学基金(61672122) 中央高校基本科研业务费专项(3132019207)。

关键词数据挖掘异常检测核密度估计核密度波动敏感性分析 data mining anomaly detection kernel density estimation kernel-density fluctuation sensitivity analysis

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1赵晓永,王宁宁,王磊.基于主动学习的离群点集成挖掘方法研究[J].计算机工程与应用,2020,56(12):112-117. 被引量：8
2赵渊,沈智健,周念成,周家启,徐焜耀.基于序贯仿真和非参数核密度估计的大电网可靠性评估[J].电力系统自动化,2008,32(6):14-19. 被引量：41

二级参考文献23

1刘海涛,程林,孙元章,郑望其.交直流系统可靠性评估[J].电网技术,2004,28(23):27-31. 被引量：74
2刘洋,周家启,谢开贵,胡小正,程建翼,曾伟民,赵渊,陈炜骏,胡博.基于Beowulf集群的大电力系统可靠性评估蒙特卡罗并行仿真[J].中国电机工程学报,2006,26(20):9-14. 被引量：31
3BILLINTON R, LI Wenyuan. Reliability assessment of electric power systems using Monte Carlo methods. New York, NY, USA:Plenum, 1994.
4UBEDA J R, ALLAN R N. Reliability assessment of composite hydrothermal generation and transmission systems using sequential simulation. IEE Proceedings:Generation, Transmission and Distribution, 1994, 141(4): 257-262.
5SANKARAKRISHNAN A, BILLINTON R. Sequential Monte Carlo simulation for composite power systems reliability analysis with time varying loads. IEEE Trans on Power Systems, 1995, 10(3):1540-1545.
6WANGDEE Wijarn, BILLINTON R. Bulk electric system wellbeing analysis using sequential Monte Carlo simulation. IEEE Trans on Power Systems,2006, 21(1): 188-193.
7BILLINTON R, WANGDEE Wijarn. Delivery point reliability indices of a bulk electric system using sequential Monte Carlo simulation. IEEE Trans on Power Systems, 2006, 21 (1): 345-351.
8ROSENBLATT M. Remarks on some nonparametric estimates of a density function. Annuals of Mathematical Statistics, 1956, 27(3): 832-837.
9PARZEN E. On estimation of a probability density function and mode. Annuals of Mathematical Statistics, 1962, 33(3) : 1065-1076.
10CACOULLOS T. Estimation of a multivariate density. Annuals of Mathematical Statistics, 1966, 18(2): 179-189.

共引文献47

1王斌,赵渊,刘威,王成亮,刘家伟.基于分裂最优乘子重要抽样的电网可靠性评估[J].电力系统自动化,2008,32(19):30-34. 被引量：15
2赵渊,张夏菲,周家启.电网可靠性评估的非参数多变量核密度估计负荷模型研究[J].中国电机工程学报,2009,29(31):27-33. 被引量：50
3赵渊,周家启,刘志宏.大电网可靠性的序贯和非序贯蒙特卡洛仿真的收敛性分析及比较[J].电工技术学报,2009,24(11):127-133. 被引量：37
4赵渊,谢开贵.电网可靠性指标概率密度分布的解析计算模型[J].中国电机工程学报,2011,31(4):31-38. 被引量：24
5赵渊,谢开贵.电网概率风险评估中元件可靠性参数的不确定性分析[J].电力系统自动化,2011,35(4):6-11. 被引量：9
6赵渊,张夏菲,谢开贵.非参数自回归方法在短期电力负荷预测中的应用[J].高电压技术,2011,37(2):429-435. 被引量：17
7胡博,谢开贵,赵渊,曹侃.电力系统可靠性评估的动态任务分配并行算法[J].电力系统自动化,2011,35(10):35-41. 被引量：19
8吴思,王建学,路建明.备用输电元件对发输电系统可靠性的影响[J].电力系统自动化,2011,35(17):5-9. 被引量：1
9黄丽华,张丽娜,霍利民.基于时序模拟的配电系统可靠性评估收敛判据[J].农业工程学报,2011,27(12):168-172. 被引量：3
10赵继超,袁越,傅质馨,孙纯军,钱康,许文超.基于Copula理论的风光互补发电系统可靠性评估[J].电力自动化设备,2013,33(1):124-129. 被引量：61

同被引文献42

1《中国公路学报》编辑部.中国交通隧道工程学术研究综述·2022[J].中国公路学报,2022,35(4):1-40. 被引量：224
2卓琳,赵厚宇,詹思延.异常检测方法及其应用综述[J].计算机应用研究,2020,37(S01):9-15. 被引量：25
3赵宏,常有康,王伟杰.深度神经网络的对抗攻击及防御方法综述[J].计算机科学,2022,49(S02):662-672. 被引量：8
4黄河,吴来明.馆藏文物保存环境研究的发展与现状[J].文物保护与考古科学,2012,24(S1):13-19. 被引量：47
5董乐红,耿国华,赵清.基于模糊推理的青铜器鉴定专家系统[J].西北大学学报（自然科学版）,2006,36(2):197-200. 被引量：4
6李新虎.测井曲线最优特征值在层序界面识别中的应用[J].湖南科技大学学报（自然科学版）,2006,21(3):26-30. 被引量：7
7易觉非.利用活度分层法实现测井自动地质分层[J].石油天然气学报,2007,29(1):78-80. 被引量：21
8曾纯净,罗佳明,郭旃.构建技术规范世界遗产的监测难题[J].中国文化遗产,2008(2):40-45. 被引量：8
9姜万录,吴胜强,刘思远.指数加权动态核主元分析法及其在故障诊断中应用[J].机械工程学报,2011,47(3):63-68. 被引量：19
10黄翔,汪超.蒸发冷却空调技术标准综述[J].制冷与空调,2011,11(3):98-102. 被引量：6

引证文献4

1孙亮.同位素注入剖面测井解释智能化批量处理技术的实现与应用[J].测井技术,2024,48(1):67-74.
2李沙沙,邢红杰.基于对抗样本和自编码器的鲁棒异常检测[J].计算机科学,2024,51(5):363-373. 被引量：1
3王琨,梁茹,侍洪波,谭帅,蔡兰坤,吴来明,徐方圆.基于数据驱动的文物环境风险状态评估方法研究[J].文物保护与考古科学,2024,36(5):143-150.
4聂其坦,肖浩汉,刘飞,刘立鹏,牛瑞强.隧洞掘进机掘进数据预处理方法及工程案例验证[J].水资源与水工程学报,2024,35(5):191-200.

二级引证文献1

1陈虓,昌燕,王丹琛,张仕斌.基于样本预处理的低成本对抗样本防御算法[J].计算机应用,2024,44(9):2756-2762.

1占妮.基于Bi-LSTMA-CNNA的线上评论情感分析模型[J].电子测量技术,2021,44(3):83-86. 被引量：5
2“灯塔”两难[J].环球财经,2021(6):49-49.
3周前前,刘骊,刘利军,付晓东,黄青松.细粒度民族服饰图像检索的全局-局部特征提取方法[J].模式识别与人工智能,2021,34(5):463-472. 被引量：9
4南京宏,张义超,李重远,解永锋,陈益.多波段红外目标的空谱关联检测算法[J].空间电子技术,2021,18(2):48-54.
5李颖,于东,胡毅,刘劲松,张丽鹏.基于时间序列波动性的分段线性表示方法[J].计算机系统应用,2021,30(6):300-305. 被引量：1
6刘玲玲,胡文业.绝经女性在骨密度测定腰椎与髋部的对比分析[J].山西大同大学学报（自然科学版）,2021,37(3):74-76.
7韩昭庆,杨霄,刘敏,何国璠.康熙《皇舆全览图》长城以南地区绘制精度的空间分异[J].清华大学学报（哲学社会科学版）,2021(3):25-33. 被引量：10
8汪颖,谢佳妮,邓凌峰,肖先勇.基于典型波形特征与改进DBSCAN的电压暂降同源识别方法[J].电力系统自动化,2021,45(11):126-135. 被引量：10
9王启栋,宋金明,袁华茂,彭晨.基于近海健康评价现有体系的我国普适海洋健康评价“双核”新框架的构建[J].生态学报,2021,41(10):3988-3997. 被引量：4
10易洁,钟茂生,刘根,王明文.基于高斯分布和汉字组件特征的中文词表示学习[J].山东大学学报（理学版）,2021,56(5):85-91.

计算机工程与应用

2021年第12期

浏览历史

内容加载中请稍等...

基于核密度波动的异常检测算法被引量：4

参考文献2

二级参考文献23

共引文献47

同被引文献42

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于核密度波动的异常检测算法 被引量：4

参考文献2

二级参考文献23

共引文献47

同被引文献42

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于核密度波动的异常检测算法被引量：4