-
题名带有超长方体约束的少数类样本生成机制
被引量:1
- 1
-
-
作者
贺作伟
陶佳晴
冷强奎
翟军昌
孟祥福
-
机构
渤海大学信息科学与技术学院
辽宁工程技术大学电子与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2022年第10期3055-3060,共6页
-
基金
国家自然科学基金资助项目(61602056、61772249)
辽宁省自然科学基金资助项目(2019-ZD-0493)
辽宁省教育厅科研项目(LQ2019012)。
-
文摘
合成少数类过采样技术(SMOTE)是解决类不平衡问题的有效方法之一。但是,SMOTE的线性插值机制将合成样本限制在原始样本的连线上,导致新样本缺乏多样性,并且这条连线穿过多数类区域时可能会生成噪声样本。针对上述问题,提出一种带有超长方体约束的少数类样本生成机制。该机制使用超长方体作为新样本的生成区域来代替线性插值,以增加合成样本与原始样本的差异性。并通过检测超长方体内是否存在多数类样本来决定是否修正此超长方体,从而防止新合成样本落入多数类区域内。使用所提机制替换线性插值,并集成在SMOTE、Borderline-SMOTE和ADASYN三种过采样方法中,然后在KEEL的11个标准数据集上进行了实验评估。结果表明,相比于原始方法,集成后的方法能够帮助分类器取得更高的F_(1)值和相当的G-mean。这说明超长方体生成机制能够显著改善分类器对少数类样本的识别能力,并且能够兼顾到多数类样本。
-
关键词
不平衡分类
过采样技术
SMOTE
生成机制
超长方体约束
-
Keywords
imbalanced classification
oversampling technique
SMOTE
generation mechanism
hypercuboid constraints
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-