期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
面向类不平衡数据集的重采样方法影响研究
1
作者 丁浩杰 《现代计算机》 2024年第14期36-40,共5页
为了评估重采样方法对类不平衡数据集的影响,对被广泛使用的美国威斯康星州的乳腺癌诊断数据集进行研究,基于逻辑斯特回归、支持向量机、随机森林等三种机器学习算法进行实验,对随机上采样抽样、随机下采样抽样、SMOTE以及ADASYN四种重... 为了评估重采样方法对类不平衡数据集的影响,对被广泛使用的美国威斯康星州的乳腺癌诊断数据集进行研究,基于逻辑斯特回归、支持向量机、随机森林等三种机器学习算法进行实验,对随机上采样抽样、随机下采样抽样、SMOTE以及ADASYN四种重采样方法使用F1值和AUC值进行了分析。实验结果表明,四种重采样方法均可以提升模型性能,其中随机下采样抽样在处理类不平衡数据集时被证明更加有效。 展开更多
关键词 重采样方法 随机下采样抽样 支持向量机 逻辑斯特回归 随机森林
下载PDF
基于马氏距离的重采样方法在流量识别中的应用 被引量:1
2
作者 时鸿涛 李洪平 刘竞 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第8期136-141,共6页
针对网络流量识别中的多分类数据分布不均衡的问题,本文提出了一种基于马氏距离的重采样方法。首先,将网络流量数据进行零均值化处理并转换至主成分空间;再根据少数类样本数据到集合中心点之间的马氏距离对其进行新样本的生成;之后将新... 针对网络流量识别中的多分类数据分布不均衡的问题,本文提出了一种基于马氏距离的重采样方法。首先,将网络流量数据进行零均值化处理并转换至主成分空间;再根据少数类样本数据到集合中心点之间的马氏距离对其进行新样本的生成;之后将新生成的样本数据转换至原始空间并进行逆零均值化处理;最后返回所有新生成的样本数据。使用剑桥大学公共网络流量数据进行流量分类实验,实验结果表明该方法能够有效提升少数类的识别准确率,并且比现有的重采样方法和成本敏感方法能够获得更好的分类效果。 展开更多
关键词 马氏距离 主成分分析 流量识别 多分类不均衡 重采样方法
下载PDF
基于交叉组合重采样的拥挤识别方法
3
作者 郑长江 王晨 《交通科学与工程》 2014年第4期77-82,共6页
针对拥挤数据分布不平衡问题,提出了一种新的重采样方法——交叉组合重采样法。该方法是将随机向下采样法与smote法相结合,对原始数据进行交叉采样,以减少采样法对原始数据的非均匀性破坏。通过仿真,得到比例为1∶10.1的非拥挤数据和拥... 针对拥挤数据分布不平衡问题,提出了一种新的重采样方法——交叉组合重采样法。该方法是将随机向下采样法与smote法相结合,对原始数据进行交叉采样,以减少采样法对原始数据的非均匀性破坏。通过仿真,得到比例为1∶10.1的非拥挤数据和拥挤数据原始样本。根据实际情况,通过交叉采样法,分别得到类比例为1∶5,1∶3以及1∶1的数据集,并对3种情况下的分类结果进行对比分析。选择朴素贝叶斯分类器、贝叶斯网络分类器及神经网络分类器,在不同比例数据集下,针对交叉组合重采样法和一般组合重采样法进行对比实验。实验结果证明:交叉组合重采样法能够更好地解决拥挤数据不平衡给分类器带来的问题。 展开更多
关键词 拥挤识别 不平衡分类 重采样方法 交叉组合 分类器
下载PDF
基于正则化粒子滤波的磁梯度张量跟踪方法 被引量:3
4
作者 张光 张英堂 +1 位作者 任国全 孙晖 《探测与控制学报》 CSCD 北大核心 2014年第2期50-52,58,共4页
针对磁梯度张量直接反演跟踪方法对噪声十分敏感的问题,提出了基于正则化粒子滤波(RPF)的磁梯度张量跟踪方法。该方法建立了包括目标位置、速度和磁矩等状态变量的状态方程,给出了表征状态向量与磁梯度张量、磁场三分量测量值关系的量... 针对磁梯度张量直接反演跟踪方法对噪声十分敏感的问题,提出了基于正则化粒子滤波(RPF)的磁梯度张量跟踪方法。该方法建立了包括目标位置、速度和磁矩等状态变量的状态方程,给出了表征状态向量与磁梯度张量、磁场三分量测量值关系的量测方程,加入了重采样等克服粒子退化现象的方法,并通过RPF方法克服粒子衰竭问题。通过仿真实验证明了RPF跟踪方法的精度远远高于直接反演跟踪方法,具有更强的抗噪声干扰能力,可以有效完成磁梯度张量跟踪。 展开更多
关键词 正则化粒子滤波 跟踪方法 磁梯度张量 重采样方法
下载PDF
基于混合多阶集成模型的非平衡热轧带钢凸度智能诊断 被引量:1
5
作者 丁成砚 孙杰 +2 位作者 李霄剑 彭文 张殿华 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第3期762-782,共21页
为了提升带钢热轧加工过程的智能化水平,基于数字孪生(DT)和信息物理系统(CPS),文本采用数据驱动方法以诊断热轧带钢凸度。因为热轧工艺具有遗传性、非线性和强耦合性的特点,因此带钢凸度诊断是一个决策边界不明确的非平衡问题。现有回... 为了提升带钢热轧加工过程的智能化水平,基于数字孪生(DT)和信息物理系统(CPS),文本采用数据驱动方法以诊断热轧带钢凸度。因为热轧工艺具有遗传性、非线性和强耦合性的特点,因此带钢凸度诊断是一个决策边界不明确的非平衡问题。现有回归方法倾向于从多数类样本学习信息,而忽略了少数类的缺陷凸度。为了解决这一问题,本文提出了一个混合多阶集成模型(HMSEN)分类带钢凸度。首先,提出了一个新的采样方法,该方法结合了自适应采样(ADASYN)和重复编辑近邻样本(RENN)以强化对缺陷凸度的关注。随后,基于增加的数据,建立了一个多阶集成模型以提升分类精度。同时,通过分析不同基分类器的组合确定了最佳性能的混合多阶集成模型。实验结果表明,相比于其它采样方法,本文提出的采样方法更适合凸度数据集。此外,混合多阶集成模型的性能要优于现有回归方法和机理模型。因此,对于非平衡热轧带钢凸度智能诊断,本文提出的混合多阶集成模型是一种有效且鲁棒的方法。 展开更多
关键词 热轧带钢凸度诊断 非平衡多类别分类 多阶集成建模 数据重采样方法 智能制造 信息物理系统
下载PDF
高分二号卫星影像几何校正方法研究 被引量:7
6
作者 杨国东 国策 张旭晴 《测绘与空间地理信息》 2018年第10期15-17,共3页
在对影响几何校正精度的因素(校正模型、控制点分布、重采样方法等)进行分析的基础上,本文对吉林省洮南地区高分二号影像分别采用有理函数、多项式、RST、局部三角网4种模型进行校正并对比其精度。同时,基于有理函数模型,分别采用最邻... 在对影响几何校正精度的因素(校正模型、控制点分布、重采样方法等)进行分析的基础上,本文对吉林省洮南地区高分二号影像分别采用有理函数、多项式、RST、局部三角网4种模型进行校正并对比其精度。同时,基于有理函数模型,分别采用最邻近像元法、双线性内插法、三次卷积法进行重采样、比较不同重采样方法对几何校正精度的影响。 展开更多
关键词 几何校正 地面控制点 几何校正模型 重采样方法 高分二号
下载PDF
吉林一号卫星影像几何校正方法试验 被引量:2
7
作者 姜春山 张旭晴 +3 位作者 杨国东 耿艳东 刘子维 王腾 《测绘与空间地理信息》 2020年第8期208-211,共4页
针对吉林一号01A星卫星影像数据的几何校正方法从模型选择、重采样方法、不同分辨率DEM数据的影响3个方面进行研究讨论。在校正模型方面,使用多项式模型、RST仿射变换模型以及RPC有理函数模型3种模型;在重采样方法上,选择了双线性内插... 针对吉林一号01A星卫星影像数据的几何校正方法从模型选择、重采样方法、不同分辨率DEM数据的影响3个方面进行研究讨论。在校正模型方面,使用多项式模型、RST仿射变换模型以及RPC有理函数模型3种模型;在重采样方法上,选择了双线性内插法、最邻近像元重采样法以及双三次卷积重采样法;最后使用两种不同的DEM数据对遥感影像进行几何校正。针对这3个方面分别进行精度评定,表明RPC有理函数模型、最邻近像元重采样法、ASTER GDEM的组合是一个较好的选择。 展开更多
关键词 吉林一号 几何校正 校正模型 重采样方法
下载PDF
开采沉陷预计数据自动嵌入矿区DEM的方法研究 被引量:5
8
作者 韩奎峰 《金属矿山》 CAS 北大核心 2009年第6期104-106,144,共4页
首先分析了几种开采沉陷预计数据(下沉,倾斜,曲率,水平移动和水平变形)的特点,介绍了上述几种数据的表达方式,根据数据特点提出了沉陷预计结果数据的预处理方法。通过研究提出了将预计结果数据嵌入矿区DEM的方法——双线性重采样插值法... 首先分析了几种开采沉陷预计数据(下沉,倾斜,曲率,水平移动和水平变形)的特点,介绍了上述几种数据的表达方式,根据数据特点提出了沉陷预计结果数据的预处理方法。通过研究提出了将预计结果数据嵌入矿区DEM的方法——双线性重采样插值法,经实例验证该方法达到了预期目标,为矿区的DEM更新做出了贡献。 展开更多
关键词 概率积分法 开采沉陷预计数据 双线性采样插值方法 DEM
下载PDF
基于均值滤波的电力系统谐波自动化检测方法 被引量:2
9
作者 沈祥 殷嘉伟 《自动化应用》 2022年第8期88-90,共3页
由于电力系统谐波频谱容易出现混叠现象,导致谐波检测效果较差,因此提出基于均值滤波的电力系统谐波自动化检测方法。采用重采样方法采集电力系统谐波信号,确定最小采样频率,避免谐波频谱出现混叠。利用均值滤波技术滤除信号中的基波分... 由于电力系统谐波频谱容易出现混叠现象,导致谐波检测效果较差,因此提出基于均值滤波的电力系统谐波自动化检测方法。采用重采样方法采集电力系统谐波信号,确定最小采样频率,避免谐波频谱出现混叠。利用均值滤波技术滤除信号中的基波分量,并根据无功分量与有功分量瞬时频谱中主频率点处的削度值判断电力系统是否存在谐波。根据基波分量与幅值计算出电力系统谐波幅值,并且确定谐波起止时间,以此实现基于均值滤波的电力系统谐波自动化检测。经实验证明,该研究方法的检测误差小于传统方法,具有较高的电力系统谐波自动化检测精度。 展开更多
关键词 均值滤波 电力系统 谐波自动化检测 重采样方法
下载PDF
基于改进粒子滤波的视觉目标跟踪 被引量:7
10
作者 赵康 王正勇 +2 位作者 何小海 郑新波 田刚 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第5期875-882,共8页
针对目标跟踪算法在精度和鲁棒性上的要求,提出一种基于改进粒子滤波的视觉目 标跟踪算法.首先,建立多种特征来描述目标外观模型,并对各特征分量的加权系数进行自适 应调节;然后,利用分类重采样方法解决原始重采样方法中的粒子退化和匮... 针对目标跟踪算法在精度和鲁棒性上的要求,提出一种基于改进粒子滤波的视觉目 标跟踪算法.首先,建立多种特征来描述目标外观模型,并对各特征分量的加权系数进行自适 应调节;然后,利用分类重采样方法解决原始重采样方法中的粒子退化和匮乏问题;最后,提出 一种新的模板更新机制,自适应选取运动模板或原始模板.实验结果表明,改进后的算法在具 有挑战的跟踪视频序列上实验,具有良好的跟踪精度和鲁棒性,能够应对视频图像分辨率不 高、目标转动变化、部分遮挡等复杂条件. 展开更多
关键词 模板更新 部分遮挡 粒子退化 重采样方法 运动模板 图像分辨率 外观模型 视觉目标跟踪
下载PDF
基于子集重采样的高维资产组合的构建
11
作者 刘丽萍 《经济研究导刊》 2018年第19期78-81,共4页
在大数据时代,高维资产对于很多金融机构非常常见,维数诅咒的影响使得在投资组合中扮演着重要角色的协方差阵的估计效率较低。将子集重采样方法应用到投资组合中,首先,从所有资产构造的集合中抽取若干个子集;然后,采用BEKK模型来估计和... 在大数据时代,高维资产对于很多金融机构非常常见,维数诅咒的影响使得在投资组合中扮演着重要角色的协方差阵的估计效率较低。将子集重采样方法应用到投资组合中,首先,从所有资产构造的集合中抽取若干个子集;然后,采用BEKK模型来估计和预测子集的协方差阵,以解决维数诅咒问题;最后,对若干个子集的同一个资产的权重向量求平均,来求得每个资产的权重。通过实证分析发现,基于子集重抽样的投资组合明显要优于传统的均值——方差投资组合,其收益更高、波动更小,并且夏普比率值也较高。 展开更多
关键词 BEKK模型 高维资产组合 子集重采样方法
下载PDF
一种混合CGAN与SMOTEENN的不平衡数据处理方法 被引量:6
12
作者 刘宁 朱波 +1 位作者 阴艳超 李岫宸 《控制与决策》 EI CSCD 北大核心 2023年第9期2614-2621,共8页
CGAN能够从数据中学习其分布特性,被引入不平衡数据处理中对少数类样本进行过采样,可以生成符合原始数据分布的新样本,因此比传统的重采样方法具有更好的处理效果.然而,CGAN对数据分布特性的学习易受限于样本规模,在少数类样本规模较小... CGAN能够从数据中学习其分布特性,被引入不平衡数据处理中对少数类样本进行过采样,可以生成符合原始数据分布的新样本,因此比传统的重采样方法具有更好的处理效果.然而,CGAN对数据分布特性的学习易受限于样本规模,在少数类样本规模较小时不能充分学习其分布特性,难以保证生成样本的质量.针对这一问题,提出一种将CGAN与SMOTEENN相结合的不平衡数据平衡化处理方法.首先,从既有的少数类样本出发,采用SMOTEENN方法生成一定规模的少数类样本;然后,在此基础上训练CGAN模型,保证其能够生成符合原始少数类样本分布特征的新样本;最后,再利用CGAN重新生成符合原始少数类样本分布的新样本构建平衡数据集.为验证所提出方法的有效性,基于公开的不平衡数据集开展对比实验研究.实验结果表明,相对几种经典的不平衡数据处理方法与近期文献报道的方法,所提出方法在几项不平衡数据分类评价指标上表现出明显的优势. 展开更多
关键词 不平衡数据 数据平衡化处理 重采样方法 CGAN SMOTEENN
原文传递
基于粒子滤波的烧结断面图像火焰区域跟踪 被引量:2
13
作者 王福斌 何江红 武晨 《激光杂志》 CAS 北大核心 2021年第12期94-101,共8页
在铁矿石烧结过程中,烧结机尾断面图像中的火焰区域蕴含着大量烧结特征信息。为有效识别烧结断面火焰核心区域,提出了改进的粒子滤波算法对烧结断面图像进行火焰区域跟踪。在经典粒子滤波算法中引入RGB颜色空间生成带权粒子。同时,烧结... 在铁矿石烧结过程中,烧结机尾断面图像中的火焰区域蕴含着大量烧结特征信息。为有效识别烧结断面火焰核心区域,提出了改进的粒子滤波算法对烧结断面图像进行火焰区域跟踪。在经典粒子滤波算法中引入RGB颜色空间生成带权粒子。同时,烧结过程中火焰区域可能合并、分裂及脱落,对粒子滤波算法中重采样方法进行权值优化、粒子舍弃与重采样策略优化,避免由粒子退化现象与样本贫乏问题引起跟踪失败。结果表明,改进的粒子滤波算法能够对烧结断面图像火焰区域进行有效、快速地跟踪。 展开更多
关键词 粒子滤波 火焰区域跟踪 RGB颜色空间 重采样方法 烧结图像
原文传递
二类不均衡数据分类问题常用策略研究 被引量:1
14
作者 杨小军 刘志 +1 位作者 王力猛 刘文 《智能计算机与应用》 2020年第11期21-26,共6页
类分布不均衡问题在现实世界中广泛存在,针对不均衡数据集的分类方法及其性能评估方法,都与传统分类算法大相径庭。本文在分析常用的二类不均衡数据分类策略的基础上,选取了十个公开的KEEL科研数据集,用G-mean值和AUC值分别衡量分类器... 类分布不均衡问题在现实世界中广泛存在,针对不均衡数据集的分类方法及其性能评估方法,都与传统分类算法大相径庭。本文在分析常用的二类不均衡数据分类策略的基础上,选取了十个公开的KEEL科研数据集,用G-mean值和AUC值分别衡量分类器的准确率和泛化性能。在KEEL平台上对常用的三类策略中的12种方法的性能进行了验证,明确了算法各自的适用情况。 展开更多
关键词 二类不均衡数据分类 重采样方法 代价敏感学习算法 集成学习算法 KEEL
下载PDF
近红外光谱结合遗传算法优化的极限学习机实现银杏叶纯化过程有效成分快速测定 被引量:10
15
作者 倪鸿飞 斯乐婷 +5 位作者 黄家鹏 昝琼 陈勇 栾连军 吴永江 刘雪松 《中国中药杂志》 CAS CSCD 北大核心 2021年第1期110-117,共8页
近红外光谱技术(near infrared spectroscopy,NIRS)结合波段筛选方法及建模算法可以实现中药生产过程分析的快速、无损检测。该文针对银参通络胶囊关键工艺银杏叶大孔树脂纯化过程,实现对洗脱液中槲皮素、山柰酚和异鼠李素3种成分含量... 近红外光谱技术(near infrared spectroscopy,NIRS)结合波段筛选方法及建模算法可以实现中药生产过程分析的快速、无损检测。该文针对银参通络胶囊关键工艺银杏叶大孔树脂纯化过程,实现对洗脱液中槲皮素、山柰酚和异鼠李素3种成分含量的快速测定。通过马氏距离算法剔除异常光谱,联合X-Y距离样本集划分(sample set partitioning based on joint X-Y distances,SPXY)方法划分数据集,基于协同区间偏最小二乘法(synergy interval partial least squares,siPLS)筛选的关键信息波段,在此基础上实施竞争自适应加权重采样方法(competitive adaptive reweighted sampling,CARS)、连续投影算法(successive projections algorithm,SPA)和蒙特卡洛无信息变量消除法(Monte Carlo uninformation variable elimination,MC-UVE)筛选波长以得到更少但更关键的变量数据,将其作为输入变量建立遗传算法优化的极限学习机(genetic algorithm joint extreme learning machine,GA-ELM)定量分析模型,并将模型性能与偏最小二乘回归(partial least squares regression,PLSR)方法建立的模型进行比较,结果表明siPLS-CARS-GA-ELM算法联用可实现以最少变量数达到最优的模型性能。槲皮素、山柰酚、异鼠李素的校正集相关系数Rc和验证集相关系数Rp均达到0.98以上,校正集误差均方根(root mean square error of calibration,RMSEC)、验证集误差均方根(root mean square error of prediction,RMSEP)和验证集相对偏差(relative standard errors of prediction,RSEP)分别为0.0300,0.0292,8.88%;0.0414,0.0348,8.46%;0.0293,0.0271,10.10%,相较于传统PLSR方法,所建立GA-ELM模型性能有较大提升,证明NIRS结合GA-ELM方法实现中药有效成分快速测定具有很大潜力。 展开更多
关键词 银参通络胶囊 近红外光谱技术 遗传算法优化的极限学习机 协同区间偏最小二乘法 竞争自适应加权重采样方法
原文传递
AMERICAN OPTION PRICING UNDER GARCH DIFFUSION MODEL: AN EMPIRICAL STUDY 被引量:2
16
作者 WU Xinyu YANG Wenyu +1 位作者 MA Chaoqun ZHAO Xiujuan 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2014年第1期193-207,共15页
The GARCH diffusion model has received much attention in recent years, as it describes financial time series better when compared to many other models. In this paper, the authors study the empirical performance of Ame... The GARCH diffusion model has received much attention in recent years, as it describes financial time series better when compared to many other models. In this paper, the authors study the empirical performance of American option pricing model when the underlying asset follows the GARCH diffusion. The parameters of the GARCH diffusion model are estimated by the efficient importance sampling-based maximum likelihood (EIS-ML) method. Then the least-squares Monte Carlo (LSMC) method is introduced to price American options. Empirical pricing results on American put options in Hong Kong stock market shows that the GARCH diffusion model outperforms the classical constant volatility (CV) model significantly. 展开更多
关键词 American option efficient importance sampling GARCH diffusion model least-squaresMonte Carlo maximum likelihood.
原文传递
A robust and efficient structural reliability method combining radial-based importance sampling and Kriging 被引量:5
17
作者 XIONG Bo TAN HuiFeng 《Science China(Technological Sciences)》 SCIE EI CAS CSCD 2018年第5期724-734,共11页
Simulation based structural reliability analysis suffers from a heavy computational burden, as each sample needs to be evaluated on the performance function, where structural analysis is performed. To alleviate the co... Simulation based structural reliability analysis suffers from a heavy computational burden, as each sample needs to be evaluated on the performance function, where structural analysis is performed. To alleviate the computational burden, related research focuses mainly on reduction of samples and application of surrogate model, which substitutes the performance function. However,the reduction of samples is achieved commonly at the expense of loss of robustness, and the construction of surrogate model is computationally expensive. In view of this, this paper presents a robust and efficient method in the same direction. The present method uses radial-based importance sampling (RBIS) to reduce samples without loss of robustness. Importantly, Kriging is fully used to efficiently implement RBIS. It not only serves as a surrogate to classify samples as we all know, but also guides the procedure to determine the optimal radius, with which RBIS would reduce samples to the highest degree. When used as a surrogate, Kriging is established through active learning, where the previously evaluated points to determine the optimal radius are reused. The robustness and efficiency of the present method are validated by five representative examples, where the present method is compared mainly with two fundamental reliability methods based on active learning Kriging. 展开更多
关键词 structural reliability simulation radial-based importance sampling Kriging active learning
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部