期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于马氏距离的重采样方法在流量识别中的应用 被引量:1
1
作者 时鸿涛 李洪平 刘竞 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第8期136-141,共6页
针对网络流量识别中的多分类数据分布不均衡的问题,本文提出了一种基于马氏距离的重采样方法。首先,将网络流量数据进行零均值化处理并转换至主成分空间;再根据少数类样本数据到集合中心点之间的马氏距离对其进行新样本的生成;之后将新... 针对网络流量识别中的多分类数据分布不均衡的问题,本文提出了一种基于马氏距离的重采样方法。首先,将网络流量数据进行零均值化处理并转换至主成分空间;再根据少数类样本数据到集合中心点之间的马氏距离对其进行新样本的生成;之后将新生成的样本数据转换至原始空间并进行逆零均值化处理;最后返回所有新生成的样本数据。使用剑桥大学公共网络流量数据进行流量分类实验,实验结果表明该方法能够有效提升少数类的识别准确率,并且比现有的重采样方法和成本敏感方法能够获得更好的分类效果。 展开更多
关键词 马氏距离 主成分分析 流量识别 多分类不均衡 重采样方法
下载PDF
基于类重叠度区分的大规模云平台任务终止状态预测
2
作者 代丽萍 王敬雄 +2 位作者 李为丽 刘春红 程渤 《中国传媒大学学报(自然科学版)》 2021年第2期44-53,共10页
大规模云平台任务终止状态的预测是云资源调度策略优化的关键步骤。本文以Google云平台的计算调度系统Borg为对象进行研究,针对任务的各种终止状态极度不均衡和类重叠的问题,提出了一种类重叠度区分的自定义步长‐梯度提升决策树(SP‐GB... 大规模云平台任务终止状态的预测是云资源调度策略优化的关键步骤。本文以Google云平台的计算调度系统Borg为对象进行研究,针对任务的各种终止状态极度不均衡和类重叠的问题,提出了一种类重叠度区分的自定义步长‐梯度提升决策树(SP‐GBDT)任务终止状态预测方法,对任务终止状态进行细粒度的多分类预测,提高少数类任务状态的预测准确率。首先将终止状态的多个类别拆分成若干个二类组合,通过支持向量数据描述模型(SVDD)筛选出类重叠度较低的最优二类组合。然后,分别对最优的二类组合进行扩展采样比例的自定义步长欠采样。最后构建梯度提升决策树模型,将欠采样之后的数据进行多分类。在Google云平台的运行监控日志数据集上进行验证,通过对比预测结果和预测过程的可解释性分析,SP‐GBDT模型能够很好地降低数据集的不均衡比例以及类重叠的程度。与决策树和随机森林等常用多分类预测方法相比,所提算法的F1‐score分别提高了30.39%和18.26%。 展开更多
关键词 终止状态 不均多分类 类重叠度 欠采样 可解释性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部