基于近邻决策域内局部分布密度的改进KNN算法被引量：2

An Improved KNN Algorithm Based on Partial Distribution Density within Neighbors Decision Domain

下载PDF

导出

摘要经典KNN算法和以往的基于密度的改进KNN算法都缺乏对训练样本数据分布的有效性描述,因此会间接影响到分类结果。提出一种基于测试样本近邻决策域内局部密度的改进KNN算法,通过计算各不同类别在近邻决策域内的局部密度,并同时考虑到类间偏斜度的存在,得到各类密度补偿系数和倾斜度平衡因子,从而达到削弱高数量、大密度类别,增强小数量、低密度类别的目的。在UCI数据集上的实验结果表明,该改进算法在保持经典KNN算法分类准确度的基础上,能够提高分类的召回率和F1-measure指标。 Both classical KNN algorithm and the previous density-based improved KNN algorithm lack effective description of distribution of training sample data.Therefore,it has bad influence on the classification results indirectly.An improved KNN algorithm based on partial distribution density within neighbors decision domain was proposed.The algorithm firstly computed the partial distribution density of different classes within neighbors decision domain.By taking class imbalance problem into consideration at the same time,density compensation coefficients and balance factors of different classes were gotten eventuelly.As a result,the importance of those classes which had higher partial density and larger numbers of samples was reduced,and those which had lower partial density and less numbers of samples increased.The experiments on UCI data sets indicated that the algorithm proposed could improve the classification indicators of recall and F1-measure on the basis of keeping a high classification accuracy of KNN algorithm.

作者史佳董昱魏宏杰景晓春史蕾

机构地区兰州交通大学自动化与电气工程学院南车株洲电力机车研究所有限公司中铁十八局集团第一工程有限公司敦格项目部甘肃省高速公路管理局

出处《科学技术与工程》北大核心 2014年第30期57-61,共5页 Science Technology and Engineering

基金国家自然科学基金(61164010)资助

关键词 KNN 局部密度决策域类偏斜 KNN partial density decision domain class imbalance problem

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献11

1刘凡,张昀,姚晓,彭倩,聂鸿宇,李剑,周湶.基于K近邻算法的换流变压器局部放电模式识别[J].电力自动化设备,2013,33(5):89-93. 被引量：36
2宋涛,汤宝平,李锋.基于流形学习和K-最近邻分类器的旋转机械故障诊断方法[J].振动与冲击,2013,32(5):149-153. 被引量：31
3余鹰,苗夺谦,刘财辉,王磊.基于变精度粗糙集的KNN分类改进算法[J].模式识别与人工智能,2012,25(4):617-623. 被引量：32
4朱岩,景丽萍,于剑.一种利用近邻和信息熵的主动文本标注方法[J].计算机研究与发展,2012,49(6):1306-1312. 被引量：4
5钟将,刘荣辉.一种改进的KNN文本分类[J].计算机工程与应用,2012,48(2):142-144. 被引量：27
6陈黎飞,郭躬德.最近邻分类的多代表点学习算法[J].模式识别与人工智能,2011,24(6):882-888. 被引量：18
7刘海峰,庞秀梅,张学仁.一种聚类模式下基于密度的改进KNN算法[J].微电子学与计算机,2011,28(7):125-127. 被引量：5
8郑蕊蕊,赵继印,赵婷婷,李敏.基于遗传支持向量机和灰色人工免疫算法的电力变压器故障诊断[J].中国电机工程学报,2011,31(7):56-63. 被引量：122
9郭躬德,黄杰,陈黎飞.基于KNN模型的增量学习算法[J].模式识别与人工智能,2010,23(5):701-707. 被引量：26
10郝秀兰,陶晓鹏,徐和祥,胡运发.kNN文本分类器类偏斜问题的一种处理对策[J].计算机研究与发展,2009,46(1):52-61. 被引量：33

二级参考文献141

1滕月阳,唐焕文,张海霞.一种新的支持向量机增量学习算法[J].计算机工程与应用,2004,40(36):77-80. 被引量：7
2王萍,傅立华,胡广振.一种基于Morlet小波分析与神经网络技术的局部放电识别方法[J].高压电器,2005,41(5):366-369. 被引量：5
3杨霁,李剑,孙才新,王有元,杨眉.基于小波多尺度变换的局部放电图像识别方法[J].电力系统自动化,2005,29(22):64-67. 被引量：8
4廖瑞金,廖玉祥,杨丽君,王有元.多神经网络与证据理论融合的变压器故障综合诊断方法研究[J].中国电机工程学报,2006,26(3):119-124. 被引量：98
5汤红诚,李著信,武华峰,王考杰.基于人工免疫的异步电机故障诊断系统[J].中国电机工程学报,2005,25(23):158-162. 被引量：12
6庞茂,周晓军,孟庆华.基于免疫学的在线故障检测算法的研究及应用[J].中国电机工程学报,2005,25(24):149-153. 被引量：7
7熊浩,孙才新,陈伟根,杜林,廖玉祥.电力变压器故障诊断的人工免疫网络分类算法[J].电力系统自动化,2006,30(6):57-60. 被引量：30
8董明,严璋,杨莉,M.D.Judd.基于证据推理的电力变压器故障诊断策略(英文)[J].中国电机工程学报,2006,26(1):106-114. 被引量：37
9苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：387
10彭斌,刘振全.基于改进小波神经网络的旋转机械故障诊断[J].振动．测试与诊断,2007,27(1):32-35. 被引量：12

共引文献314

1赵璐,何子况,朱秋煜.基于CNN和BIRCH聚类算法的类别增量学习[J].电子测量技术,2020(11):79-84. 被引量：1
2隋国华,李春雷.基于组合分类器的地层含油情况智能决策系统[J].计算机研究与发展,2011,48(S3):476-479.
3罗俊.一种基于图的层次多标记文本分类方法[J].计算机应用研究,2010,27(3):909-912. 被引量：1
4袁鼎荣,钟宁,张师超.文本信息处理研究述评[J].计算机科学,2011,38(2):9-13. 被引量：11
5黄杰,郭躬德,陈黎飞.增量KNN模型的修剪策略研究[J].小型微型计算机系统,2011,32(5):845-849. 被引量：6
6符杨,曹望舒,郑小霞.基于人工免疫方法的变压器故障诊断[J].上海电力学院学报,2011,27(6):559-562. 被引量：1
7周靖,刘晋胜.基于分类贡献有效值的增量KNN模型修剪研究[J].计算机工程与应用,2012,48(3):185-188. 被引量：1
8唐勇波,桂卫华,彭涛,欧阳伟.基于重构贡献和灰关联熵的变压器诊断方法[J].仪器仪表学报,2012,33(1):132-138. 被引量：13
9庞观松,蒋盛益.文本自动分类技术研究综述[J].情报理论与实践,2012,35(2):123-128. 被引量：33
10刘赫,张相洪,刘大有,李燕军,尹立军.一种基于最大边缘相关的特征选择方法[J].计算机研究与发展,2012,49(2):354-360. 被引量：9

同被引文献21

1王鹏,孟丹,詹剑锋,涂碧波.数据密集型计算编程模型研究进展[J].计算机研究与发展,2010,47(11):1993-2002. 被引量：39
2陆广泉,谢扬才,刘星,张师超.一种基于KNN的半监督分类改进算法[J].广西师范大学学报（自然科学版）,2012,30(1):45-49. 被引量：7
3刘舒,姜琦刚,邵永社,李远华.应用灰度共生矩阵的纹理特征描述的研究[J].科学技术与工程,2012,20(33):8909-8914. 被引量：11
4Kang Guosheng,Liu Jianxun,Tang Mingdong,Cao Buqing.WEB SERVICE SELECTION ALGORITHM BASED ON PRINCIPAL COMPONENT ANALYSIS[J].Journal of Electronics(China),2013,30(2):204-212. 被引量：4
5闫永刚,马廷淮,王建.KNN分类算法的MapReduce并行化实现[J].南京航空航天大学学报,2013,45(4):550-555. 被引量：21
6王睿.基于MapReduce的并行KNN分类算法研究[J].计算机与数字工程,2013,41(11):1738-1740. 被引量：3
7郝胜轩,宋宏,周晓锋.基于近邻噪声处理的KNN缺失数据填补算法[J].计算机仿真,2014,31(7):264-268. 被引量：29
8韩晓光,曲武,姚宣霞,郭长友,周芳.基于纹理指纹的恶意代码变种检测方法研究[J].通信学报,2014,35(8):125-136. 被引量：56
9赵玉丹,王倩,范九伦,刘颖,高梓铭.基于模糊KNN的刑侦图像场景分类[J].计算机应用研究,2014,31(10):3158-3160. 被引量：9
10刘天时,肖敏敏,李湘眷.融合方向测度和灰度共生矩阵的纹理特征提取算法研究[J].科学技术与工程,2014,22(32):271-275. 被引量：8

引证文献2

1王江涛,陈锻生,温新竹.基于Hadoop平台的KNN分类器的优化和实现[J].太原理工大学学报,2016,47(4):513-517. 被引量：2
2范志鹏,李军,刘宇强,钮焱.基于灰度纹理指纹的恶意代码分类[J].科学技术与工程,2020,20(29):12014-12020. 被引量：7

二级引证文献9

1冯巍,邱占芝,宋旭东.基于分布式K近邻的护舷撞击能量预测法[J].计算机工程与设计,2017,38(10):2740-2744. 被引量：1
2赵书涛,李云鹏,王二旭,朱继鹏,马莉,王科登.基于电—振信号熵权特征的断路器储能机构故障诊断方法[J].高压电器,2019,55(11):204-210. 被引量：10
3刘紫煊,王晨.基于多特征融合的BiLSTM恶意代码分类[J].电子设计工程,2022,30(18):67-72. 被引量：3
4刘家银,李馥娟,马卓,夏玲玲.基于多尺度卷积神经网络的恶意代码分类方法[J].信息网络安全,2022(10):31-38. 被引量：1
5毕凯峰,王健.基于特征匹配的计算机网络恶意代码预警系统[J].微型电脑应用,2023,39(6):54-57. 被引量：1
6杨攀烁,贾文阁,刘森,李吉生,张平,李旭,李彬,安国庆,安琪,韩晓慧.基于小波变换和灰度-梯度共生矩阵的局部放电特征提取及识别[J].科学技术与工程,2023,23(27):11673-11680. 被引量：1
7田志新,徐震,茅健,林彬彬,廖薇.基于多尺度特征融合的钢材表面缺陷分类方法[J].电子科技,2024,37(2):87-94.
8Li Li,Youran Kong,Qing Zhang.Lightweight Malicious Code Classification Method Based on Improved Squeeze Net[J].Computers, Materials & Continua,2024,78(1):551-567.
9李豪,钱丽萍,朱晓慧.基于区块重组和双通道可视化的恶意代码分类[J].计算机应用与软件,2024,41(10):342-348.

1刘慧,杨宏光.应用于中文文本分类的改进KNN算法[J].今日科苑,2010(8):54-55. 被引量：2
2林啟锋,蒙祖强,陈秋莲,陈智敏.结合语义和文本特征位串的高效KNN算法[J].计算机工程与设计,2013,34(7):2417-2421. 被引量：1
3张俊丽,张帆.改进KNN算法在垃圾邮件过滤中的应用[J].现代图书情报技术,2007(4):75-78. 被引量：14
4周靖,刘晋胜.特征联合熵的一种改进K近邻分类算法[J].计算机应用,2011,31(7):1785-1788. 被引量：8
5党宏社,白梅,张娜.基于ReliefF特征加权和KNN的自然图像分类方法[J].电视技术,2015,39(19):10-13. 被引量：2
6甘守飞.基于改进kNN算法的人脸识别研究[J].佛山科学技术学院学报（自然科学版）,2015,33(3):52-55. 被引量：4
7郝卫杰,王艳飞,胡敬伟,张公敬.基于超球区域划分的改进KNN算法[J].青岛大学学报（自然科学版）,2017,30(1):85-90. 被引量：5
8古丽娜孜,孙铁利,胡西旦,伊力亚尔,库瓦特拜克.一种基于改进KNN的哈萨克语文本分类[J].东北师大学报（自然科学版）,2014,46(2):63-68. 被引量：4
9许杞刚,刘明军,李海.基于改进KNN算法的农产品价格预测模型[J].济南大学学报（自然科学版）,2014,28(2):114-117. 被引量：6
10冯晶.基于改进KNN算法的价格预测模型研究[J].计算机光盘软件与应用,2011(14):69-70.

科学技术与工程

2014年第30期

浏览历史

内容加载中请稍等...

基于近邻决策域内局部分布密度的改进KNN算法被引量：2

参考文献11

二级参考文献141

共引文献314

同被引文献21

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于近邻决策域内局部分布密度的改进KNN算法 被引量：2

参考文献11

二级参考文献141

共引文献314

同被引文献21

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于近邻决策域内局部分布密度的改进KNN算法被引量：2