期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于加权合成少数类过采样技术的故障诊断 被引量:1
1
作者 韩志艳 王健 《计算机技术与发展》 2016年第9期43-46,共4页
合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)是一种著名的过采样方法,但是它没有考虑样本的分布和潜在的噪声数据。为了改善SMOTE的性能,提出了加权合成少数类过采样技术(Weighted Synthetic Minority Over... 合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)是一种著名的过采样方法,但是它没有考虑样本的分布和潜在的噪声数据。为了改善SMOTE的性能,提出了加权合成少数类过采样技术(Weighted Synthetic Minority Oversampling Technique,WSMOTE)。WSMOTE通过引入邻域并将样本按照分布的不同划分为不同的组群,不同的群组拥有不同的采样价值,然后根据采样价值的不同加权合成样本。WSMOTE在处理类别不平衡数据时具有优异的性能,并在半导体制造过程的监控数据仿真中得到了验证。 展开更多
关键词 故障诊断 类别不平衡 smote 过采样技术
下载PDF
SMOTE类算法研究综述 被引量:1
2
作者 王晓霞 李雷孝 林浩 《计算机科学与探索》 CSCD 北大核心 2024年第5期1135-1159,共25页
合成少数类过采样技术(SMOTE)因能有效处理少数类样本已成为处理不平衡数据的主流方法之一,而且许多SMOTE改进算法已被提出,但目前已有的调研极少考虑到流行的算法级改进方法。因此对现有SMOTE类算法进行更全面的分析与总结。首先详细... 合成少数类过采样技术(SMOTE)因能有效处理少数类样本已成为处理不平衡数据的主流方法之一,而且许多SMOTE改进算法已被提出,但目前已有的调研极少考虑到流行的算法级改进方法。因此对现有SMOTE类算法进行更全面的分析与总结。首先详细阐述了SMOTE方法的基本原理,然后主要从数据级、算法级两个层面系统性地梳理分析SMOTE类算法,并介绍数据级和算法级混合改进的新思路。数据级改进是在预处理时通过不同操作删除或添加数据来平衡数据分布;算法级改进不会改变数据分布,主要通过修改或创建算法来加强对少数类样本的关注度。二者相比,数据级方法应用受限更少,算法级改进的算法鲁棒性普遍更高。为了更全面地提供SMOTE类算法的基础研究材料,最后列出常用数据集、评价指标,给出未来可能尝试进行的研究思路,以更好地应对不平衡数据问题。 展开更多
关键词 不平衡数据 合成少数类过采样技术(smote) 过采样 监督学习
下载PDF
小样本下基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断
3
作者 葛平淑 王朝阳 +3 位作者 王阳 张涛 薛红涛 夏晨迪 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第8期1-9,共9页
轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据... 轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据集,生成与真实样本分布相似的故障样本,并使用主成分分析(PCA)优化其时域和频域的特征。然后,通过引入非线性收敛因子和Levy飞行策略改进传统的灰狼优化算法(GWO),使用改进的灰狼优化算法(IGWO)优化随机森林(RF)模型的参数。最后,基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断模型实现故障状态的识别,并在轮毂电机试验台架上进行了实验验证。结果表明,所提出的轮毂电机轴承故障诊断方法在7种转速工况下平均准确率均超过96%,具有高精度和稳定性。与遗传算法(GA)、粒子群优化算法(PSO)、GWO优化RF相比,提出的IGWO-RF模型在3种小样本训练集下的诊断准确率均超过90%,且准确率均明显高于其他3个对比算法,能够有效实现小样本条件下的轮毂电机轴承故障诊断。 展开更多
关键词 轮毂电机 轴承 合成少数类过采样技术(smote) 改进灰狼优化算法(IGWO) 随机森林(RF) 故障诊断
下载PDF
构造性覆盖算法的SMOTE过采样方法 被引量:8
4
作者 严远亭 朱原玮 +2 位作者 吴增宝 张以文 张燕平 《计算机科学与探索》 CSCD 北大核心 2020年第6期975-984,共10页
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数... 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题。此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视。针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE。CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法。在12个典型的不平衡数据集上验证CMOTE算法的性能。实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力。 展开更多
关键词 不平衡数据 过采样技术 合成少数类过采样技术(smote) 构造性覆盖算法(CCA)
下载PDF
一种自适应核SMOTE-SVM算法用于不平衡数据分类 被引量:9
5
作者 吴海燕 陈晓磊 范国轩 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期97-104,共8页
面向不平衡样本集,提出一种自适应核人工合成过采样-支持向量机(synthetic minority oversampling technique-support vector machine,SMOTE-SVM)分类算法。首先通过支持向量机将数据集投影到核空间,找出类边界样本—支持向量(SV),然后... 面向不平衡样本集,提出一种自适应核人工合成过采样-支持向量机(synthetic minority oversampling technique-support vector machine,SMOTE-SVM)分类算法。首先通过支持向量机将数据集投影到核空间,找出类边界样本—支持向量(SV),然后基于核距离对少数类样本集的支持向量(SV+)计算其近邻,再根据近邻样本类别分布自适应地选择内插或外推两种方式合成新样本。由于核空间中映射函数无法具体得知,新样本无法用显式表示,因此将生成样本与原始样本一起形成增广Gram矩阵,最终利用SVM实现分类。该算法中样本生成、近邻计算以及SVM分类均统一在同一核空间中,提高了新样本的可信性;同时自适应插值方式改善了传统人工合成过采样技术(SMOTE)线性生成算法不适用于非线性分类的问题,提高了新样本的多样性。在多个数据集上的实验结果表明,所提算法可以改善不平衡数据的分类准确率,具有更好的稳健性。 展开更多
关键词 不平衡数据分类 人工合成过采样技术(smote) 核空间 支持向量机
下载PDF
面向非平衡多分类问题的二次合成QSMOTE方法 被引量:2
6
作者 韩明鸣 郭虎升 王文剑 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第1期1-13,共13页
近年来非平衡多分类数据的学习问题在机器学习和数据挖掘领域备受关注,上采样技术成为解决数据不平衡问题的主要方法,然而已有的上采样技术仍有很多的不足,例如新合成的少数类样本仍可能分布在对应少数类样本的原始区域内,不能有效改善... 近年来非平衡多分类数据的学习问题在机器学习和数据挖掘领域备受关注,上采样技术成为解决数据不平衡问题的主要方法,然而已有的上采样技术仍有很多的不足,例如新合成的少数类样本仍可能分布在对应少数类样本的原始区域内,不能有效改善数据分布的不平衡情况.此外,若原始样本中不同类别样本分布存在重叠,则新合成的样本会更容易偏离到其他类样本分布中,从而造成过泛化现象,影响少数类样本的分类精度.为解决上述问题,提出一种二次合成的上采样方法(Quadratic Synthetic Minority Over-sampling Technique,QSMOTE).首先通过少数类样本的支持度选择包含重要信息的样本来进行第一次合成,然后通过分析指定少数类样本质心的邻域内样本分布情况来调整第二次样本合成范围,并最终进行第二次合成.在UCI和MNIST数据集上的实验结果表明,QSMOTE不仅可以改善数据分布的不平衡问题,而且可以尽可能地减少过泛化现象,特别是对少数类样本的分类准确率有大幅提升. 展开更多
关键词 多类非平衡问题 过泛化 重叠 合成少数类上采样技术(smote)
下载PDF
基于SMOTE算法的船体结构极限状态代理模型研究 被引量:1
7
作者 康煜晗 裴志勇 吴卫国 《武汉理工大学学报(交通科学与工程版)》 2023年第6期1089-1094,1101,共7页
建立典型集装箱船舱段结构参数化有限元模型,基于SMOTE过采样算法,增加样本数据中失效面附近样本点的数量,分别采用BP神经网络、径向基神经网络以及支持向量机三种代理模型技术,结合十折交叉验证法调试模型参数以提高模型的泛化能力,完... 建立典型集装箱船舱段结构参数化有限元模型,基于SMOTE过采样算法,增加样本数据中失效面附近样本点的数量,分别采用BP神经网络、径向基神经网络以及支持向量机三种代理模型技术,结合十折交叉验证法调试模型参数以提高模型的泛化能力,完成构建船体舱段结构极限状态代理模型并对其进行测试与分析,获得了效果与泛化能力均较为优良的船体结构极限状态高精度代理模型.结果表明:经SMOTE算法处理的样本数据结合BP神经网络代理模型技术,能够在不增加有限元计算任务量的同时提高船体结构极限状态代理模型的精度. 展开更多
关键词 船体结构可靠性 代理模型技术 smote过采样算法 交叉验证
下载PDF
基于KNN和自适应的过采样方法
8
作者 张怀啸 陈卓 周必良 《信息与电脑》 2023年第3期93-95,共3页
针对少数类合成过采样技术(Synthetic Minority Oversampling Technique,SMOTE)及其改进算法在不平衡数据分类问题中分类效果不佳,提出了基于K最邻近算法(K-NearestNeighbor,KNN)和自适应的过采样方法(Oversampling Method Based on KNN... 针对少数类合成过采样技术(Synthetic Minority Oversampling Technique,SMOTE)及其改进算法在不平衡数据分类问题中分类效果不佳,提出了基于K最邻近算法(K-NearestNeighbor,KNN)和自适应的过采样方法(Oversampling Method Based on KNN and Adaptive,KAO)。首先,利用KNN去除噪声样本;其次,根据少数类样本K近邻样本中多数类样本数,自适应给少数类样本分配过采样权重;最后,利用新的插值方式生成新样本平衡数据集。在KEEL公开的数据集上进行实验,将提出的KAO算法与SMOTE及其改进算法进行对比,在F1值和g-mean上都有所提升。 展开更多
关键词 不平衡数据分类 少数类合成过采样技术(smote) K最邻近算法(KNN) 自适应 过采样
下载PDF
基于改进SMOTE的非平衡数据集分类研究 被引量:19
9
作者 王超学 潘正茂 +2 位作者 董丽丽 马春森 张星 《计算机工程与应用》 CSCD 2013年第2期184-187,245,共5页
针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少... 针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制。将SSMOTE与KNN(K-Nearest Neighbor)算法结合来处理不平衡数据集的分类问题。通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能。 展开更多
关键词 非平衡数据集 分类 支持度 轮盘赌选择 合成少数过采样技术(smote)
下载PDF
面向不平衡数据集的改进型SMOTE算法 被引量:25
10
作者 王超学 张涛 马春森 《计算机科学与探索》 CSCD 2014年第6期727-734,共8页
针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使... 针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使用交叉、变异算子实现对合成样本质量的控制。结合GA-SMOTE与SVM(support vector machine)算法来处理不平衡数据的分类问题。UCI数据集上的大量实验表明,GA-SMOTE在新样本的整体合成效果上表现出色,有效提高了SVM在不平衡数据集上的分类性能。 展开更多
关键词 不平衡数据集 分类 遗传算子 少数类样本合成过采样技术(smote) SYNTHETIC MINORITY OVER-SAMPLING technique (smote)
下载PDF
基于改进SMOTE的不平衡数据挖掘方法研究 被引量:31
11
作者 杨智明 乔立岩 彭喜元 《电子学报》 EI CAS CSCD 北大核心 2007年第B12期22-26,共5页
少类样本合成过采样技术(SMOTE)是一种新型的过采样方法,能够有效地处理不平衡数据分类问题,但SMOTE在产生合成样本的过程中,存在一定的盲目性.因此本文提出一种改进的过采样方法一自适应SMOTE,根据样本集内部分布特性,自适应调... 少类样本合成过采样技术(SMOTE)是一种新型的过采样方法,能够有效地处理不平衡数据分类问题,但SMOTE在产生合成样本的过程中,存在一定的盲目性.因此本文提出一种改进的过采样方法一自适应SMOTE,根据样本集内部分布特性,自适应调整SMOTE方法中近邻选择策略,控制合成样本的质量.算法分析和仿真结果表明,文中提出的方法在不影响计算复杂度的前提下,有效地提高了分类算法的整体分类准确率。 展开更多
关键词 不平衡数据集 少类样本合成过采样技术 自适应smote 合成样本 近邻选择策略
下载PDF
基于SMOTE算法和条件生成对抗网络的到港航班延误分类预测 被引量:7
12
作者 刘博 卢婷婷 +1 位作者 张兆宁 张健斌 《科学技术与工程》 北大核心 2021年第34期14843-14852,共10页
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)算法和条件生成对抗网络(condi... 由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)算法和条件生成对抗网络(conditional generative adversarial nets,CGAN)的航班延误预测模型。首先,利用SMOTE算法对原始数据集进行上采样,并融合经过训练的CGAN生成指定样本数据集,缓解原始数据集中某些类别样本量少和数据非平衡等问题;再次,采用XGBoost模型在4种模式训练集上进行训练和超参数寻优;最后,以K近邻、支持向量机和随机森林为基准模型进行性能对比分析。经试验分析,通过分类器在融合样本集的训练,整体上可以在一定程度上提高模型的泛化性,尤其在轻度延误和中度延误类别中提升较为明显,与不采用融合方法比较,宏平均下的Precision、Recall、F_(1)-score值分别提升了0.16、0.29、0.24个百分点。实验结果表明,该方法能够有效地对航班延误非平衡数据进行建模,在保持模型整体性能较高的前提下,能够显著地提升少数类的预测能力,可以为空管、航空公司和机场等提供决策依据。 展开更多
关键词 航班延误 非平衡数据集 合成少数类过采样技术(smote)算法 条件生成对抗网络 XGBoost模型 分类问题
下载PDF
一种基于SVM的非均衡数据集过采样方法 被引量:15
13
作者 张忠林 冯宜邦 赵中恺 《计算机工程与应用》 CSCD 北大核心 2020年第23期220-228,共9页
针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on... 针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on SVM)。SVMOM通过迭代合成样本。在迭代过程中,通过SVM得到分类超平面;根据每个少数类样本到分类超平面的距离赋予样本距离权重;同时考虑少数类样本的类内平衡,根据样本的分布计算样本的密度,赋予样本密度权重;依据样本的距离权重和密度权重计算每个少数类样本的选择权重,根据样本的选择权重选择样本运用SMOTE合成新样本,达到平衡数据集的目的。实验结果表明,提出的算法在一定程度上解决了分类结果偏向多数类的问题,验证了算法的有效性。 展开更多
关键词 不平衡数据 支持向量机(SVM) 过采样 样本权重 合成少数类过采样技术(smote)
下载PDF
基于混合采样的非平衡数据分类算法 被引量:20
14
作者 吴艺凡 梁吉业 王俊红 《计算机科学与探索》 CSCD 北大核心 2019年第2期342-349,共8页
过采样和欠采样方法是处理非平衡数据集分类的常用方法,但使用单一的采样算法可能造成少数类样本过拟合或者丢失含有重要信息的样本。提出了基于分类超平面的混合采样算法SVM_HS(hybrid sampling algorithm based on support vector mac... 过采样和欠采样方法是处理非平衡数据集分类的常用方法,但使用单一的采样算法可能造成少数类样本过拟合或者丢失含有重要信息的样本。提出了基于分类超平面的混合采样算法SVM_HS(hybrid sampling algorithm based on support vector machine),旨在克服SVM算法在处理非平衡数据时分类超平面容易偏向少数类样本的问题。该算法首先利用SVM算法得到分类超平面。然后迭代进行混合采样,主要包括:(1)删除离分类超平面较远的一些多数类样本;(2)对靠近真实类边界的少数类样本用SMOTE(synthetic minority oversampling technique)过采样,使分类超平面向着真实类边界方向偏移。实验结果表明相比其他相关算法,该算法的F-value值和G-mean值均有较大提高。 展开更多
关键词 非平衡 支持向量机(SVM) 少数类样本过采样技术(smote) 分类超平面 混合采样
下载PDF
基于改进SMOTE的制造过程不平衡数据分类策略 被引量:5
15
作者 黎旭 陈家兑 +1 位作者 吴永明 宗文泽 《计算机工程与应用》 CSCD 北大核心 2022年第16期284-291,共8页
不平衡数据分析是智能制造的关键技术之一,其分类问题已成为机器学习和数据挖掘的研究热点。针对目前不平衡数据过采样策略中人工合成数据边缘化且需要降噪处理的问题,提出一种基于改进SMOTE(synthetic minority oversampling technique... 不平衡数据分析是智能制造的关键技术之一,其分类问题已成为机器学习和数据挖掘的研究热点。针对目前不平衡数据过采样策略中人工合成数据边缘化且需要降噪处理的问题,提出一种基于改进SMOTE(synthetic minority oversampling technique)和局部离群因子(local outlier factor,LOF)的过采样算法。首先对整个数据集进行K-means聚类,筛选出高可靠性样本进行改进SMOTE算法过采样,然后采用LOF算法删除误差大的人工合成样本。在4个UCI不平衡数据集上的实验结果表明,该方法对不平衡数据中少数类的分类能力更强,有效地克服了数据边缘化问题,将算法应用于磷酸生产中的不平衡数据,实现了该不平衡数据的准确分类。 展开更多
关键词 不平衡数据 过采样 局部离群因子 聚类 合成少数过采样技术(smote)
下载PDF
针对不平衡数据的过采样和随机森林改进算法 被引量:36
16
作者 张家伟 郭林明 杨晓梅 《计算机工程与应用》 CSCD 北大核心 2020年第11期39-45,共7页
针对数据不平衡带来的少数类样本识别率低的问题,提出通过加权策略对过采样和随机森林进行改进的算法,从数据预处理和算法两个方面降低数据不平衡对分类器的影响。数据预处理阶段应用合成少数类过采样技术(Synthetic Minority Oversampl... 针对数据不平衡带来的少数类样本识别率低的问题,提出通过加权策略对过采样和随机森林进行改进的算法,从数据预处理和算法两个方面降低数据不平衡对分类器的影响。数据预处理阶段应用合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)降低数据不平衡度,每个少数类样本根据其相对于剩余样本的欧氏距离分配权重,使每个样本合成不同数量的新样本。算法改进阶段利用Kappa系数评价随机森林中决策树训练后的分类效果,并赋予每棵树相应的权重,使分类能力更好的树在投票阶段有更大的投票权,提高随机森林算法对不平衡数据的整体分类性能。在KEEL数据集上的实验表明,与未改进算法相比,改进后的算法对少数类样本分类准确率和整体样本分类性能有所提升。 展开更多
关键词 数据不平衡 合成少数类过采样技术(smote) Kappa系数 随机森林
下载PDF
基于Lévy分布的不平衡数据过采样方法 被引量:1
17
作者 张扬帆 张海鹏 孙俊 《计算机工程与应用》 CSCD 北大核心 2019年第16期150-156,共7页
针对不平衡数据集上的分类问题,提出了基于Lévy分布的过采样方法,其核心思想是根据初始数据集的分布,利用Lévy分布构造新样本的密度分布。基于Lévy分布的特性,使得从边界样本合成的新样本密度最大,靠近多数类的样本合成... 针对不平衡数据集上的分类问题,提出了基于Lévy分布的过采样方法,其核心思想是根据初始数据集的分布,利用Lévy分布构造新样本的密度分布。基于Lévy分布的特性,使得从边界样本合成的新样本密度最大,靠近多数类的样本合成的新样本密度次之,靠近少数类的样本合成的新样本密度最小。因此,该算法可以增强分类边界,同时可以减小噪声生成。通过在多个数据集上的实验,表明所提算法可以有效改善不平衡数据的分类效果。 展开更多
关键词 不平衡分类 Lévy分布 过采样 人工合成过采样技术(smote)
下载PDF
L-SMOTE与SVM结合的不平衡数据集分类研究 被引量:12
18
作者 罗康洋 王国强 《计算机工程与应用》 CSCD 北大核心 2019年第17期55-62,220,共9页
针对不平衡数据集的低分类效率,基于L-SMOTE算法和混合核SVM提出了一种改进的SMOTE算法(FTLSMOTE)。利用混合核SVM对数据集进行分类。提出了噪声样本识别三原则对噪声样本进行精确识别并予以剔除,进而利用F-SMOTE和T-SMOTE算法分别对错... 针对不平衡数据集的低分类效率,基于L-SMOTE算法和混合核SVM提出了一种改进的SMOTE算法(FTLSMOTE)。利用混合核SVM对数据集进行分类。提出了噪声样本识别三原则对噪声样本进行精确识别并予以剔除,进而利用F-SMOTE和T-SMOTE算法分别对错分和正确分类的少类样本进行采样。如此循环,直到满足终止条件,算法结束。通过在UCI数据集上与经典的SMOTE等重要采样算法以及标准SVM的大量实验表明,该方法具有更好的分类效果,改进算法与L-SMOTE算法相比,运算时间大幅减少。 展开更多
关键词 不平衡数据集 分类 结合少数过采样技术(smote) 混合核函数 支持向量机
下载PDF
基于特征优化和BP神经网络的入侵检测方法 被引量:19
19
作者 王伟 代红 赵斯祺 《计算机工程与设计》 北大核心 2021年第10期2755-2761,共7页
为提高网络入侵检测率,提出一个集特征优化和人工神经网络于一体的网络入侵识别发现框架AS-BP。引入SMOTE技术和随机采样技术对数据进行平衡约简处理,解决数据不平衡问题,利用集成方法对网络入侵数据进行重要特征提取,降低数据处理维度... 为提高网络入侵检测率,提出一个集特征优化和人工神经网络于一体的网络入侵识别发现框架AS-BP。引入SMOTE技术和随机采样技术对数据进行平衡约简处理,解决数据不平衡问题,利用集成方法对网络入侵数据进行重要特征提取,降低数据处理维度,通过优化BP神经网络算法,对网络入侵数据进行判断完成分类。实验结果表明,该方法克服了传统BP神经网络建模时间过长的问题,在不降低其它攻击类型检测率的同时,提高U2R和R2L的检测率,克服了数据集中少数类数据量过少导致的少数类检测率低的问题。将实验结果与其它分类方法进行比较,验证了该方法的准确率、精确率和召回率优于其它方法。 展开更多
关键词 入侵检测 smote技术 随机采样技术 集成方法 BP神经网络
下载PDF
针对不平衡数据集的Bagging改进算法 被引量:12
20
作者 李明方 张化祥 《计算机工程与应用》 CSCD 北大核心 2010年第30期40-42,共3页
传统的Bagging分类方法对不平衡数据集进行分类时,虽然能够达到很高的分类精度,但是对其中少数类的分类准确率不高。为提高其对少数类数据的分类精度,利用SMOTE算法对样例集中的少数类样例进行加工,在Bagging算法中根据类值对各个样例... 传统的Bagging分类方法对不平衡数据集进行分类时,虽然能够达到很高的分类精度,但是对其中少数类的分类准确率不高。为提高其对少数类数据的分类精度,利用SMOTE算法对样例集中的少数类样例进行加工,在Bagging算法中根据类值对各个样例的权重进行调整。混淆矩阵和ROC曲线表明改进算法达到了既能保证整体的分类准确率,又能提高少数类分类精度的目的。 展开更多
关键词 不平衡类 少类样本合成过采样技术(smote) BAGGING算法 权重 受试者工作特征曲线(ROC)
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部