期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于马氏距离的重采样方法在流量识别中的应用
被引量:
1
1
作者
时鸿涛
李洪平
刘竞
《中国海洋大学学报(自然科学版)》
CAS
CSCD
北大核心
2019年第8期136-141,共6页
针对网络流量识别中的多分类数据分布不均衡的问题,本文提出了一种基于马氏距离的重采样方法。首先,将网络流量数据进行零均值化处理并转换至主成分空间;再根据少数类样本数据到集合中心点之间的马氏距离对其进行新样本的生成;之后将新...
针对网络流量识别中的多分类数据分布不均衡的问题,本文提出了一种基于马氏距离的重采样方法。首先,将网络流量数据进行零均值化处理并转换至主成分空间;再根据少数类样本数据到集合中心点之间的马氏距离对其进行新样本的生成;之后将新生成的样本数据转换至原始空间并进行逆零均值化处理;最后返回所有新生成的样本数据。使用剑桥大学公共网络流量数据进行流量分类实验,实验结果表明该方法能够有效提升少数类的识别准确率,并且比现有的重采样方法和成本敏感方法能够获得更好的分类效果。
展开更多
关键词
马氏距离
主成分分析
流量识别
多分类不均衡
重采样方法
下载PDF
职称材料
基于类重叠度区分的大规模云平台任务终止状态预测
2
作者
代丽萍
王敬雄
+2 位作者
李为丽
刘春红
程渤
《中国传媒大学学报(自然科学版)》
2021年第2期44-53,共10页
大规模云平台任务终止状态的预测是云资源调度策略优化的关键步骤。本文以Google云平台的计算调度系统Borg为对象进行研究,针对任务的各种终止状态极度不均衡和类重叠的问题,提出了一种类重叠度区分的自定义步长‐梯度提升决策树(SP‐GB...
大规模云平台任务终止状态的预测是云资源调度策略优化的关键步骤。本文以Google云平台的计算调度系统Borg为对象进行研究,针对任务的各种终止状态极度不均衡和类重叠的问题,提出了一种类重叠度区分的自定义步长‐梯度提升决策树(SP‐GBDT)任务终止状态预测方法,对任务终止状态进行细粒度的多分类预测,提高少数类任务状态的预测准确率。首先将终止状态的多个类别拆分成若干个二类组合,通过支持向量数据描述模型(SVDD)筛选出类重叠度较低的最优二类组合。然后,分别对最优的二类组合进行扩展采样比例的自定义步长欠采样。最后构建梯度提升决策树模型,将欠采样之后的数据进行多分类。在Google云平台的运行监控日志数据集上进行验证,通过对比预测结果和预测过程的可解释性分析,SP‐GBDT模型能够很好地降低数据集的不均衡比例以及类重叠的程度。与决策树和随机森林等常用多分类预测方法相比,所提算法的F1‐score分别提高了30.39%和18.26%。
展开更多
关键词
终止状态
不均
衡
多分类
类重叠度
欠采样
可解释性
下载PDF
职称材料
题名
基于马氏距离的重采样方法在流量识别中的应用
被引量:
1
1
作者
时鸿涛
李洪平
刘竞
机构
中国海洋大学信息工程学院
出处
《中国海洋大学学报(自然科学版)》
CAS
CSCD
北大核心
2019年第8期136-141,共6页
基金
国家高技术研究发展计划项目(2013AA09A506-4)资助~~
文摘
针对网络流量识别中的多分类数据分布不均衡的问题,本文提出了一种基于马氏距离的重采样方法。首先,将网络流量数据进行零均值化处理并转换至主成分空间;再根据少数类样本数据到集合中心点之间的马氏距离对其进行新样本的生成;之后将新生成的样本数据转换至原始空间并进行逆零均值化处理;最后返回所有新生成的样本数据。使用剑桥大学公共网络流量数据进行流量分类实验,实验结果表明该方法能够有效提升少数类的识别准确率,并且比现有的重采样方法和成本敏感方法能够获得更好的分类效果。
关键词
马氏距离
主成分分析
流量识别
多分类不均衡
重采样方法
Keywords
Mahalanobis distance
principal component analysis
traffic identification
multi-class imbalance
resampling method
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于类重叠度区分的大规模云平台任务终止状态预测
2
作者
代丽萍
王敬雄
李为丽
刘春红
程渤
机构
河南师范大学计算机与信息工程学院
智慧商务与物联网技术河南省工程实验室
北京邮电大学网络与交换技术国家重点实验室
出处
《中国传媒大学学报(自然科学版)》
2021年第2期44-53,共10页
文摘
大规模云平台任务终止状态的预测是云资源调度策略优化的关键步骤。本文以Google云平台的计算调度系统Borg为对象进行研究,针对任务的各种终止状态极度不均衡和类重叠的问题,提出了一种类重叠度区分的自定义步长‐梯度提升决策树(SP‐GBDT)任务终止状态预测方法,对任务终止状态进行细粒度的多分类预测,提高少数类任务状态的预测准确率。首先将终止状态的多个类别拆分成若干个二类组合,通过支持向量数据描述模型(SVDD)筛选出类重叠度较低的最优二类组合。然后,分别对最优的二类组合进行扩展采样比例的自定义步长欠采样。最后构建梯度提升决策树模型,将欠采样之后的数据进行多分类。在Google云平台的运行监控日志数据集上进行验证,通过对比预测结果和预测过程的可解释性分析,SP‐GBDT模型能够很好地降低数据集的不均衡比例以及类重叠的程度。与决策树和随机森林等常用多分类预测方法相比,所提算法的F1‐score分别提高了30.39%和18.26%。
关键词
终止状态
不均
衡
多分类
类重叠度
欠采样
可解释性
Keywords
termination statuses
unbalanced multi-classification
class-overlap
under-sampling
interpretability
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于马氏距离的重采样方法在流量识别中的应用
时鸿涛
李洪平
刘竞
《中国海洋大学学报(自然科学版)》
CAS
CSCD
北大核心
2019
1
下载PDF
职称材料
2
基于类重叠度区分的大规模云平台任务终止状态预测
代丽萍
王敬雄
李为丽
刘春红
程渤
《中国传媒大学学报(自然科学版)》
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部