-
题名面向类不平衡网络流量的特征选择算法
被引量:5
- 1
-
-
作者
唐宏
刘丹
姚立霜
王云锋
裴作飞
-
机构
重庆邮电大学通信与信息工程学院
移动通信技术重庆市重点实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2021年第4期923-930,共8页
-
基金
长江学者和创新团队发展计划(IRT_16R72)。
-
文摘
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次,充分考虑特征与类别间、特征与特征之间的相关性,利用加权对称不确定性和近似马尔科夫毯删除不相关特征及冗余特征;最后,利用基于相关性度量的特征评估函数以及序列搜索算法进一步降低特征维数,确定最优特征子集。实验表明,在保证算法整体分类精确率的前提下,算法能够有效提高小类别的分类性能。
-
关键词
流量分类
特征选择
类不平衡
加权对称不确定性
近似马尔科夫毯
-
Keywords
Traffic classification
Feature selection
Class imbalance
Weighted Symmetric Uncertainty(WSU)
Approximate Markov Blanket(AMB)
-
分类号
TN915
[电子电信—通信与信息系统]
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于自适应遗传算法的混合特征选择方法
被引量:9
- 2
-
-
作者
裴作飞
李兆玉
王云锋
姚立霜
-
机构
重庆邮电大学通信与信息工程学院
-
出处
《计算机应用与软件》
北大核心
2020年第8期256-259,306,共5页
-
基金
长江学者和创新团队发展计划项目(IRT_16R72)。
-
文摘
高维数据含有大量冗余和噪音特征影响检测效果,维度过高使得系统训练时间长、实时性差。采用卡方(Chi Square)过滤算法,删除冗余和相关性低的特征;采用LightGBM算法作为封装方法组成混合特征选择算法,通过自适应遗传算法进行搜索获取最优特征子集。在入侵检测KDDCUP99数据集上进行3种算法的对比验证。实验结果表明,该方法具有较好的检测效果和特征约减能力。
-
关键词
遗传算法
混合特征选择
入侵检测
-
Keywords
Genetic algorithm
Hybrid feature selection
Intrusion detection
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名面向类不平衡流量数据的分类模型
被引量:7
- 3
-
-
作者
刘丹
姚立霜
王云锋
裴作飞
-
机构
重庆邮电大学通信与信息工程学院
移动通信技术重庆市重点实验室(重庆邮电大学)
-
出处
《计算机应用》
CSCD
北大核心
2020年第8期2327-2333,共7页
-
基金
长江学者和创新团队发展计划(IRT_16R72)。
-
文摘
针对网络流量分类过程中,传统模型在小类别上的分类性能较差和难以实现频繁、及时更新的问题,提出一种基于集成学习的网络流量分类模型(ELTCM)。首先,根据类别分布信息定义了偏向于小类别的特征度量,利用加权对称不确定性和近似马尔可夫毯(AMB)对网络流量特征进行降维,减小类不平衡问题带来的影响;然后,引入早期概念漂移检测增强模型应对流量特征随网络变化而变化的能力,并通过增量学习的方式提高模型更新训练的灵活性。利用真实流量数据集进行实验,仿真结果表明,与基于C4.5决策树的分类模型(DTITC)和基于错误率的概念漂移检测分类模型(ERCDD)相比,ELTCM的平均整体精确率分别提高了1.13%和0.26%,且各小类别的分类性能皆优于对比模型。ELTCM有较好的泛化能力,能在不牺牲整体分类精度的情况下有效提高小类别的分类性能。
-
关键词
流量分类
类不平衡
特征选择
增量学习
集成学习
-
Keywords
traffic classification
class imbalance
feature selection
incremental learning
ensemble learning
-
分类号
TP393.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于EMD聚类的实时网络流量预测模型
被引量:11
- 4
-
-
作者
姚立霜
刘丹
裴作飞
王云锋
-
机构
重庆邮电大学通信与信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2020年第S02期316-320,共5页
-
基金
长江学者和创新团队发展计划(IRT_16R72)。
-
文摘
针对复杂的网络流量呈现出的多种特性,传统的单一模型预测效果差。为了提高流量预测的准确性和实时性,提出了一种基于经验模态分解(EMD)和聚类的网络流量预测模型。首先通过EMD将网络流量分解为不同时间尺度上频率单一的本征模函数(IMFs);其次通过改进的K均值聚类算法对IMF分量做聚类分析,将复杂度相近的IMF分量聚到一起;然后对聚类的IMF分量用自回归移动平均(ARMA)模型进行预测;最后将各IMF分量序列的预测值进行求和得到网络流量的预测值。实验结果证明,与EMD-ARMA模型相比,该模型不仅缩短了训练耗时,且均方误差(MSE)、平均绝对误差(MAE)分别下降了13.8%和7.6%,趋势预测准确率(APT)提高了6%,提高了网络流量的预测精度,可用于实时流量预测。
-
关键词
网络流量
经验模态分解
K均值聚类
自回归移动平均
流量预测
-
Keywords
Network traffic
EMD
K-means clustering
ARMA
Traffic prediction
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进引力搜索算法的SVM的参数优化及应用
被引量:7
- 5
-
-
作者
王云锋
刘丹
裴作飞
姚丽霜
-
机构
重庆邮电大学通信与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第S01期152-154,共3页
-
基金
长江学者和创新团队发展计划资助项目(IRT_16R72)
-
文摘
引力搜索算法是自然启发算法中流行的一种自适应搜索算法,该算法利用牛顿引力定律寻找最优解。引力搜索算法的性能受勘探开发能力的影响,kbest是控制这一权衡的参数之一。提出了一种新的混沌引力搜索算法,利用kbest中的混沌模型来平衡勘探和开发的非线性关系。该算法在后续迭代中收敛速度快、精度高、不陷入局部最优。实验结果验证了该算法的有效性,同时介绍了粒子群优化的惯性权重和全局记忆。采用改进的重力搜索算法对SVM参数进行优化,并利用测试函数和数据集进行验证,结果显示在入侵检测数据集,改进算法比原始算法正确率提升约5%;在wine数据集,运行时间减少了约16%。实验结果表明该优化算法在后续迭代中收敛速度快、精度高、不易陷入局部最优。
-
关键词
支持向量机
引力搜索算法
参数优化
入侵检测
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-