期刊文献+
共找到905篇文章
< 1 2 46 >
每页显示 20 50 100
不平衡数据下基于SVM增量学习的指挥信息系统状态监控方法
1
作者 焦志强 易侃 +1 位作者 张杰勇 姚佩阳 《系统工程与电子技术》 EI CSCD 北大核心 2024年第3期992-1003,共12页
针对指挥信息系统历史状态样本有限的特点,基于支持向量机(support vector machines,SVM)设计了一种面向不平衡数据的SVM增量学习方法。针对系统正常/异常状态样本不平衡的情况,首先利用支持向量生成一部分新样本,然后通过分带的思想逐... 针对指挥信息系统历史状态样本有限的特点,基于支持向量机(support vector machines,SVM)设计了一种面向不平衡数据的SVM增量学习方法。针对系统正常/异常状态样本不平衡的情况,首先利用支持向量生成一部分新样本,然后通过分带的思想逐带产生分布更加均匀的新样本以调节原样本集的不平衡比。针对系统监控实时性要求高且在运行过程中会有新样本不断加入的特点,采用增量学习的方式对分类模型进行持续更新,在放松KKT(Karush-Kuhn-Tucker)更新触发条件的基础上,通过定义样本重要度并引入保留率和遗忘率的方式减少了增量学习过程中所需训练的样本数量。为了验证算法的有效性和优越性,实验部分在真实系统中获得的数据集以及UCI数据集中3类6组不平衡数据集中与现有的算法进行了对比。结果表明,所提算法能够有效实现对不平衡数据的增量学习,从而满足指挥信息系统状态监控的需求。 展开更多
关键词 指挥信息系统 系统监控 支持向量机 不平衡数据 增量学习
下载PDF
基于知识蒸馏的不平衡数据下入侵检测方法研究
2
作者 董国芳 刘兵 鲁烨堃 《云南民族大学学报(自然科学版)》 CAS 2024年第2期219-224,共6页
基于深度学习的网络入侵检测模型面临模型结构复杂、部署效率低及流量数据类别不平衡的问题.针对这些问题,提出了1种结合知识蒸馏和类别权重焦点损失的网络入侵检测方法.该方法以精度高、参数量较多的入侵检测模型作为教师模型,与小型... 基于深度学习的网络入侵检测模型面临模型结构复杂、部署效率低及流量数据类别不平衡的问题.针对这些问题,提出了1种结合知识蒸馏和类别权重焦点损失的网络入侵检测方法.该方法以精度高、参数量较多的入侵检测模型作为教师模型,与小型学生模型生成蒸馏损失;引入增加类别权重的焦点损失函数作为学生损失;结合蒸馏损失与学生损失生成总的损失函数优化学生模型.实验结果表明,该方法性能相较于非蒸馏模型在各项指标上均有一定提升. 展开更多
关键词 入侵检测 深度学习 知识蒸馏 不平衡数据 焦点损失
下载PDF
基于改进级联算法的不平衡数据集分类检测算法
3
作者 吕文官 薛峰 《保定学院学报》 2024年第2期98-103,共6页
以提升不平衡数据集分类检测为研究目标,提出基于改进级联算法的不平衡数据集分类检测算法.首先,采用卡尔曼滤波法进行数据去噪预处理,利用小波阈值去噪算法二次消除噪声数据,并对去噪结果进行归一化预处理;利用DPC算法提取数据的局部... 以提升不平衡数据集分类检测为研究目标,提出基于改进级联算法的不平衡数据集分类检测算法.首先,采用卡尔曼滤波法进行数据去噪预处理,利用小波阈值去噪算法二次消除噪声数据,并对去噪结果进行归一化预处理;利用DPC算法提取数据的局部密度特征,利用时间编码挖掘数据的时序性特征,采用Apriori算法的强关联规则提取数据集特征;利用模糊层次聚类算法对支持向量机进行优化,实现数据类型的划分;利用改进的级联算法联合布谷鸟算法实现不平衡数据集分类检测.实验结果表明本方法的分类协方差低于0.15,检测准确率高于95%,检测时间低于2.2 ms,有效提升了不平衡数据集分类检测效果. 展开更多
关键词 卡尔曼滤波 改进级联算法 不平衡数据 分类检测
下载PDF
微生物不平衡数据重采样算法的比较研究
4
作者 温柳英 谢潇楠 《微型电脑应用》 2024年第4期25-30,共6页
重采样算法的主要思想为原始数据集经欠采样、过采样或混合采样处理,生成一个趋于平衡的数据集,进而使用经典的分类算法解决类不平衡问题。在疾病诊断领域,微生物数据集由于其高稀疏性,与其他不平衡数据集有较大区别。现有的重采样算法... 重采样算法的主要思想为原始数据集经欠采样、过采样或混合采样处理,生成一个趋于平衡的数据集,进而使用经典的分类算法解决类不平衡问题。在疾病诊断领域,微生物数据集由于其高稀疏性,与其他不平衡数据集有较大区别。现有的重采样算法已在其他领域得到验证,但在疾病诊断领域,很少有研究对此类算法的有效性和适用性进行深入对比。基于此,对现有的重采样算法利用不同的微生物数据集和分类器进行研究比对。根据重采样算法的采样效果、分类器在不同数据集上的分类性能和不同分类器在数据集上的分类性能等3个方面分析实验结果,得到在不同的评价指标下最适用的重采样算法。验证了重采样算法在处理微生物不平衡数据集上的有效性,有利于解决数据不平衡分类问题,有助于在疾病诊断领域中研究人员快速选择合适的重采样算法和分类器。 展开更多
关键词 重采样算法 疾病诊断 微生物数据 不平衡数据 分类器
下载PDF
基于机器学习的不平衡数据下个人信用评分预测模型研究
5
作者 费振华 《长江信息通信》 2024年第4期112-114,共3页
文章介绍了个人信用评分的基本概念,以及不平衡数据及其处理方法和机器学习算法在信用评分中的应用。然后,通过数据预处理,包括数据来源与特性、数据清洗与整理、数据不平衡分析、数据增强方法和效果评估,为后续模型构建提供基础。最后... 文章介绍了个人信用评分的基本概念,以及不平衡数据及其处理方法和机器学习算法在信用评分中的应用。然后,通过数据预处理,包括数据来源与特性、数据清洗与整理、数据不平衡分析、数据增强方法和效果评估,为后续模型构建提供基础。最后,使用实际数据集进行模型训练和测试,并评估模型的性能。实验结果表明,基于机器学习的不平衡数据下个人信用评分预测模型能够有效地预测个人信用风险,对于金融机构的风险管理和信贷决策具有重要意义。 展开更多
关键词 个人信用评分 不平衡数据 机器学习 数据预处理 模型研究
下载PDF
利用可信反事实的不平衡数据过采样方法
6
作者 高峰 宋媚 祝义 《计算机工程与应用》 CSCD 北大核心 2024年第5期165-171,共7页
针对传统过采样方法不能充分利用数据集信息的缺陷,提出一种基于反事实(counterfactual,CF)的不平衡数据过采样方法,并进一步对生成的少数类合成样本进行了“可信”清除。其核心思想是依据数据集原有实例特征值合成新样本,相比传统过采... 针对传统过采样方法不能充分利用数据集信息的缺陷,提出一种基于反事实(counterfactual,CF)的不平衡数据过采样方法,并进一步对生成的少数类合成样本进行了“可信”清除。其核心思想是依据数据集原有实例特征值合成新样本,相比传统过采样的插值法,更能充分挖掘数据中的边界决策信息,从而为分类器提供更多的有用信息,提高分类性能。在9个来自KEEL与UCI的不平衡数据集、5种不同分类器(SVM、DT、Logistic、RF、AdaBoost)上与4种传统过采样方法(SMOTE、B1-SMOTE、B2-SMOTE、ADASYN)进行了大量对比实验,结果表明,所提方法具有更高的AUC值、F1值和G-mean值,可以更为有效地解决类不平衡问题。 展开更多
关键词 不平衡数据 分类器 过采样 反事实(CF)
下载PDF
不平衡数据集下基于多粒度近邻图的智能电表故障分类方法
7
作者 黄子健 高欣 +3 位作者 李保丰 翟峰 秦煜 叶平 《电网技术》 EI CSCD 北大核心 2024年第3期1291-1300,共10页
智能电表故障的准确预测对实现计量设备精准主动运维、保障电网稳定运行具有重要意义。电表各故障类型样本的出现频次不同,且不同故障类型样本在高维特征空间中的分布存在重叠,这极大增加了故障预测的难度。现有不平衡分类方法通过构建... 智能电表故障的准确预测对实现计量设备精准主动运维、保障电网稳定运行具有重要意义。电表各故障类型样本的出现频次不同,且不同故障类型样本在高维特征空间中的分布存在重叠,这极大增加了故障预测的难度。现有不平衡分类方法通过构建单一样本信息与其对应类别标签的映射关系来划分样本类型,导致对具有相似表征信息的重叠区样本难以准确判别,降低了整体分类精度。该文提出一种基于多粒度近邻图的智能电表故障分类方法。首先,选择原始数据集中样本作为目标样本,以目标样本及其近邻样本作为节点、目标样本与其近邻样本连线作为边构建近邻图。根据选择的近邻样本数量不同构建多粒度近邻图,实现目标样本的信息扩充和训练样本的数量扩增,更有利于模型稳定训练。构建编码器挖掘近邻图节点特征,利用图注意力机制,根据近邻图节点编码特征和节点邻接关系将近邻样本信息自适应地聚合到目标样本,实现对相似样本差异的有效挖掘。对于给定测试样本,通过集成测试样本多粒度近邻图的分类结果,得到更精准、更鲁棒的智能电表故障预测结果。在20个KEEL(knowledge extraction based on evolutionary learning)和UCI(UC Irvine machine learning repository)不平衡分类公开数据集和智能电表实际故障数据集上的大量实验结果表明,与17种典型方法相比,该文所提算法在处理智能电表故障分类问题上具有显著优势。 展开更多
关键词 智能电表故障分类 不平衡数据 多粒度近邻图 图神经网络 样本信息聚合
原文传递
一种不平衡数据多策略处理及组合分类算法
8
作者 张晓鹏 秦亮曦 《计算机应用与软件》 北大核心 2024年第4期242-250,305,共10页
针对传统机器学习算法分类不平衡数据时分类结果通常会忽略少数类的问题,提出一种基于多策略处理的组合分类算法MsBoost。对数据进行聚类;对少数类进行过抽样,对多数类采用提出的“三合一”算法进行欠抽样;为不同类的样本赋予不同的权重... 针对传统机器学习算法分类不平衡数据时分类结果通常会忽略少数类的问题,提出一种基于多策略处理的组合分类算法MsBoost。对数据进行聚类;对少数类进行过抽样,对多数类采用提出的“三合一”算法进行欠抽样;为不同类的样本赋予不同的权重;将抽样后的两类样本结合,并用AdaBoost算法对基学习器进行组合。将MsBoost算法与AdaBoost、RusBoost、SmoteBoost和CusBoost算法在12个KEEL不平衡数据集上做了性能对比实验,该算法在AUC和G-mean指标值均取得了6次最优和2次次优的结果,在F1分数指标上取得了1次最优和6次次优的结果,表明该算法能有效地分类不平衡数据。 展开更多
关键词 不平衡数据 分类 抽样 代价敏感 组合
下载PDF
基于全局优化GAN的不平衡数据故障诊断
9
作者 刘雪锋 李京忠 王现辉 《机械设计与制造》 北大核心 2024年第3期11-17,共7页
为解决不平衡数据深度学习特征提取不准确,导致误分类率高的问题,提出了一种基于全局优化生成对抗网络的不平衡数据故障诊断方法。首先利用自动编码器解码网络和深度神经网络故障诊断结果指导生成器的训练,有效地避免了模型崩溃和梯度... 为解决不平衡数据深度学习特征提取不准确,导致误分类率高的问题,提出了一种基于全局优化生成对抗网络的不平衡数据故障诊断方法。首先利用自动编码器解码网络和深度神经网络故障诊断结果指导生成器的训练,有效地避免了模型崩溃和梯度消失的问题。然后设计了一种两级判别器,通过增加深度神经网络故障诊断模型作为附加判别器,同时,采用传统的判别器对不合格的故障样本进行滤波。通过生成器和两个分级鉴别器交替优化,同时提高了生成器的生成能力以及鉴别器的识别能力。实验结果表明提出的方法能够有效地提升不平衡样本故障诊断精度。 展开更多
关键词 不平衡数据 全局优化 生成对抗网络 故障诊断
下载PDF
基于VAE的工业过程不平衡数据故障诊断
10
作者 王敖 田颖 《理论数学》 2024年第4期80-90,共11页
深度学习技术的快速发展为工业过程故障诊断问题提供了越来越多的解决方法,但在训练数据集不平衡的情况下,深度学习方法的表现往往不能令人满意。因此,本文提出了一种应用于工业过程中的不平衡数据故障诊断策略。首先使用有限的故障样... 深度学习技术的快速发展为工业过程故障诊断问题提供了越来越多的解决方法,但在训练数据集不平衡的情况下,深度学习方法的表现往往不能令人满意。因此,本文提出了一种应用于工业过程中的不平衡数据故障诊断策略。首先使用有限的故障样本训练VAE模型并生成增强样本,之后将生成的样本用于丰富不平衡数据集,最终使用深度神经网络进行故障诊断。采用PRONTO数据集对提出的方法进行验证,实验结果表明本文提出的故障诊断策略能够有效提高模型的故障诊断性能。 展开更多
关键词 工业过程 故障诊断 变分自编码器 不平衡数据 数据增强
下载PDF
不平衡数据集梯度提升算法研究
11
作者 杨森 罗立帆 +1 位作者 刘桓竭 曾求初 《微型计算机》 2024年第3期67-69,共3页
随着机器学习在各个领域的应用不断扩大,处理不平衡数据集的挑战越发显著。不平衡数据集的问题在医学诊断、信用欺诈检测和工业质检等领域广泛存在,提高对不平衡数据集的处理能力至关重要。本文构建XGBoost、LightGBM和CatBoost三种预... 随着机器学习在各个领域的应用不断扩大,处理不平衡数据集的挑战越发显著。不平衡数据集的问题在医学诊断、信用欺诈检测和工业质检等领域广泛存在,提高对不平衡数据集的处理能力至关重要。本文构建XGBoost、LightGBM和CatBoost三种预测分类模型,通过调整参数,使用AUC值作为评分标准,并对比各分类模型在该数据集上的表现情况。 展开更多
关键词 机器学习 不平衡数据 预测模型 AUC值
下载PDF
一种自适应核SMOTE-SVM算法用于不平衡数据分类 被引量:5
12
作者 吴海燕 陈晓磊 范国轩 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期97-104,共8页
面向不平衡样本集,提出一种自适应核人工合成过采样-支持向量机(synthetic minority oversampling technique-support vector machine,SMOTE-SVM)分类算法。首先通过支持向量机将数据集投影到核空间,找出类边界样本—支持向量(SV),然后... 面向不平衡样本集,提出一种自适应核人工合成过采样-支持向量机(synthetic minority oversampling technique-support vector machine,SMOTE-SVM)分类算法。首先通过支持向量机将数据集投影到核空间,找出类边界样本—支持向量(SV),然后基于核距离对少数类样本集的支持向量(SV+)计算其近邻,再根据近邻样本类别分布自适应地选择内插或外推两种方式合成新样本。由于核空间中映射函数无法具体得知,新样本无法用显式表示,因此将生成样本与原始样本一起形成增广Gram矩阵,最终利用SVM实现分类。该算法中样本生成、近邻计算以及SVM分类均统一在同一核空间中,提高了新样本的可信性;同时自适应插值方式改善了传统人工合成过采样技术(SMOTE)线性生成算法不适用于非线性分类的问题,提高了新样本的多样性。在多个数据集上的实验结果表明,所提算法可以改善不平衡数据的分类准确率,具有更好的稳健性。 展开更多
关键词 不平衡数据分类 人工合成过采样技术(SMOTE) 核空间 支持向量机
下载PDF
面向不平衡数据的配电网故障停电预测方法 被引量:1
13
作者 范敏 杨青 +3 位作者 郭祥富 刘昊 夏嘉璐 彭屿雯 《电力系统保护与控制》 EI CSCD 北大核心 2023年第8期96-106,共11页
配电网故障停电事件会严重影响正常的社会经济生活。因此,迫切需要有效的配电网故障停电预测方法。采用人工智能方法分析配电网故障停电数据,发现存在配电网故障停电次数较少和引发配电网故障停电的原因分布不均等数据不平衡情况。为了... 配电网故障停电事件会严重影响正常的社会经济生活。因此,迫切需要有效的配电网故障停电预测方法。采用人工智能方法分析配电网故障停电数据,发现存在配电网故障停电次数较少和引发配电网故障停电的原因分布不均等数据不平衡情况。为了及时、准确地预测配电网故障停电情况,从数据集质量和防止过拟合两方面入手改进故障停电预测模型。首先,设计了基于聚类的对抗神经网络来增强数据集质量。其次,构造了基于随机代价敏感卷积神经网络(Random Cost-CNN)的故障停电预测模型。Random Cost-CNN预测算法中采用有放回随机抽样思想设计了损失函数的随机选择策略,用以解决常规代价敏感过度拟合少数类(故障停电类)而使得大量多数类(正常类)被误报的问题,既保证少数类具有较好召回率与精确度,同时又提高了模型的泛化性能。实验证明所提方法能有效预测配电网故障停电事件发生概率,在配电网运维管理中能够发挥较好的预警作用。 展开更多
关键词 故障停电预测 不平衡数据分类 过拟合 Random Cost-CNN
下载PDF
面向ICS不平衡数据的重叠区混合采样方法
14
作者 高冰 顾兆军 +1 位作者 周景贤 隋翯 《计算机工程与应用》 CSCD 北大核心 2023年第19期305-315,共11页
工业控制系统异常检测面临着数据不平衡问题,其中,不平衡数据存在的类重叠现象加剧了分类器的检测难度。基于数据类别平衡或数据重叠检测的应对策略较常被采用,但这些策略方法存在着模型稳定性差或重叠识别率低等问题。对此,提出了一种... 工业控制系统异常检测面临着数据不平衡问题,其中,不平衡数据存在的类重叠现象加剧了分类器的检测难度。基于数据类别平衡或数据重叠检测的应对策略较常被采用,但这些策略方法存在着模型稳定性差或重叠识别率低等问题。对此,提出了一种面向重叠区域的混合采样方法:OverlapRHS。该方法利用支持向量数据描述分别在多数类和少数类样本上构建重叠检测模型,并通过将合成少数类与邻域清洗进行组合,对重叠数据区域内的样本施以混合采样。最后该方法与4种经典分类器结合,在4个公开的不平衡数据集上进行了测试,并与其他4种处理不平衡问题的采样方法进行了比较。实验结果表明,所提方法能够有效检测出不平衡数据集中的重叠数据,并通过高效且针对性强的数据混合采样改善了分类器的训练效果,提高了分类器对不平衡数据的异常检测性能,展现了较之于其他采样方法在不平衡数据处理上的显著优势。 展开更多
关键词 工业控制系统 不平衡数据 类重叠 支持向量数据描述 混合采样 异常检测
下载PDF
基于对不平衡数据集进行二次迁移学习的滚动轴承剥落类故障诊断方法
15
作者 郭俊锋 王淼生 王智明 《上海交通大学学报》 EI CAS CSCD 北大核心 2023年第11期1512-1521,共10页
滚动轴承在运行过程中正常工作状态时间长,故障时间很短,导致数据集不平衡,从而极大地影响深度学习模型故障诊断的准确率.针对该问题,提出一种基于二次迁移学习的滚动轴承不平衡数据集故障诊断方法.首先使用源域和目标域中的少量数据通... 滚动轴承在运行过程中正常工作状态时间长,故障时间很短,导致数据集不平衡,从而极大地影响深度学习模型故障诊断的准确率.针对该问题,提出一种基于二次迁移学习的滚动轴承不平衡数据集故障诊断方法.首先使用源域和目标域中的少量数据通过条件梯度惩罚生成对抗网络(CWGAN-GP)生成过渡数据集,然后将搭建好的卷积神经网络模型在源域数据集、过渡数据集和目标域数据集之间进行两次迁移,最后使用目标域的少量数据对迁移后的模型进行微调,得到最终的故障诊断模型.实验结果表明,该方法对不同工况下数据集不平衡的滚动轴承剥落类故障有较好的诊断识别效果. 展开更多
关键词 迁移学习 故障诊断 不平衡数据 生成对抗网络
下载PDF
基于构造性神经网络与全局密度信息的不平衡数据欠采样方法
16
作者 严远亭 马迎澳 +1 位作者 任艳平 张燕平 《计算机科学》 CSCD 北大核心 2023年第10期48-58,共11页
多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失。然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样... 多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失。然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样面临的主要挑战。针对该挑战,提出了一种基于构造性神经网络和全局分布密度的不平衡数据集欠采样方法。该方法首先基于构造性神经网络,设计了一种多数类局部模式的学习方法;然后基于多数类局部模式,设计了两种具有结构保持特性的样本选择策略;最后针对局部模式学习的随机性可能导致的采样结果非优的问题,进一步引入了bagging集成策略,提升了方法的性能。在59个数据集上与13种对比方法进行了对比实验,验证了所提方法在G-mean,AUC和F1-score这3个常用指标上的有效性。 展开更多
关键词 欠采样 不平衡数据 分布密度 构造性神经网络 集成学习
下载PDF
基于自然最近邻的不平衡数据欠采样方法
17
作者 孟东霞 魏晓光 柳凌燕 《统计与决策》 北大核心 2023年第15期52-56,共5页
针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的... 针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。 展开更多
关键词 不平衡数据 欠采样 自然最近邻
下载PDF
面向不平衡数据和特征冗余的网络入侵检测
18
作者 张翼英 王德龙 +2 位作者 渠慧颖 张傲 张磊 《天津科技大学学报》 CAS 2023年第5期57-63,共7页
为了解决传统方法因数据不平衡及特征冗余而导致检测准确率不高的问题,提出了一种结合SMOTE(synthetic minority over-sampling technique)算法采样的SDAE-LSTM(stacked deep auto-encoder-long short term memory)入侵检测模型。首先,... 为了解决传统方法因数据不平衡及特征冗余而导致检测准确率不高的问题,提出了一种结合SMOTE(synthetic minority over-sampling technique)算法采样的SDAE-LSTM(stacked deep auto-encoder-long short term memory)入侵检测模型。首先,针对数据不平衡问题,采用SMOTE算法在少数类样本点之间随机插入样本增加其数量,达到类间平衡的目的。其次,针对特征冗余问题,利用堆叠式深度自编码器(stacked deep auto-encoder,SDAE)进行降维,实现数据的深度特征提取。最后,基于长短期记忆(long short term memory,LSTM)神经网络,精准捕获网络入侵特征,准确地实现入侵检测。通过在UNSW-NB15数据集上的大量实验,有效证明了本文模型与其他模型相比有着更好的入侵检测效果。 展开更多
关键词 不平衡数据 特征冗余 SMOTE 堆叠式深度自编码器 长短期记忆神经网络 网络入侵检测
下载PDF
面向不平衡数据集的矿井通风系统智能故障诊断
19
作者 赵丹 沈志远 宋子豪 《煤炭学报》 EI CAS CSCD 北大核心 2023年第11期4112-4123,共12页
及时准确判断故障分支的位置对保障矿井通风系统的可靠性和安全性意义重大。针对实际工况下,矿井通风系统故障样本数据存在不平衡性,导致传统的机器学习模型诊断能力与泛化能力差的问题,提出了一种面向通风系统不平衡数据集的WGAN-div-R... 及时准确判断故障分支的位置对保障矿井通风系统的可靠性和安全性意义重大。针对实际工况下,矿井通风系统故障样本数据存在不平衡性,导致传统的机器学习模型诊断能力与泛化能力差的问题,提出了一种面向通风系统不平衡数据集的WGAN-div-RF故障诊断模型。以简单通风网络为例构造了不平衡比分别为2∶1、5∶1、10∶1、20∶1的故障数据集,深入分析了不平衡样本集对通风系统故障诊断的影响。搭建了基于Wasserstein距离生成对抗网络(WGAN-div)对不平衡数据集进行数据增强处理,在构建网络时创新性地加入了残差块,提高了生成数据的质量,实现原始样本的有效扩充。结合集成学习中的随机森林(RF)模型实现通风系统故障分支诊断。以东山煤矿通风系统为实验对象,分别进行了不同数据增强模型、不同分类模型以及不同数据生成率下的故障诊断对比实验,以多种评价指标及t-SNE可视化对模型有效性进行评估。结果表明:加入残差块的WGAN-div模型生成数据与真实数据具有很好的相似性,相较于GAN模型、WGAN模型和WGAN-gp模型,WGAN-div模型更具优越性;应用WGAN-div模型进行数据增强后,机器学习分类模型的性能提升明显;当扩充数据集达到平衡时,与其他集成模型及常用的矿井通风系统故障诊断SVM模型相比,RF模型在R_(e)、P_(r)、G_(mean)和F1指标上均占优势。 展开更多
关键词 矿井通风系统 故障诊断 不平衡数据 生成对抗网络 随机森林
下载PDF
基于DBSCAN聚类分解和过采样的随机森林不平衡数据分类算法
20
作者 赵小强 姚青磊 《兰州理工大学学报》 CAS 北大核心 2023年第6期80-89,共10页
针对传统方法在不平衡数据分类时易导致生成假样本数量多或数据丢失等问题,提出了一种基于DBSCAN聚类分解和过采样的随机森林不平衡数据分类算法.首先,将基于密度的DBSCAN聚类分解算法应用于不平衡数据集的多数类,在没有数据丢失的情况... 针对传统方法在不平衡数据分类时易导致生成假样本数量多或数据丢失等问题,提出了一种基于DBSCAN聚类分解和过采样的随机森林不平衡数据分类算法.首先,将基于密度的DBSCAN聚类分解算法应用于不平衡数据集的多数类,在没有数据丢失的情况下降低了多数类样本的优势;其次,通过Borderline-SMOTE算法对少数类进行过采样,增加了少数类样本的数量,从而得到更加平衡的数据集,有效地解决了过采样时生成过多假样本而导致过拟合的问题,同时避免了欠采样方法造成数据丢失的问题;最后,在聚类分解和过采样算法的前提下,验证了随机森林比SVM、Adaboost、Bagging、XGBoost有更好的效果.在KEEL公用数据集上与其他流行算法进行实验比较,结果显示该算法有效地提高了不平衡数据的分类性能. 展开更多
关键词 不平衡数据 分类算法 DBSCAN 随机森林
下载PDF
上一页 1 2 46 下一页 到第
使用帮助 返回顶部