期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
采用特征变量选择和长短期记忆网络的高速公路交通事件检测研究 被引量:4
1
作者 张兵 张校梁 +2 位作者 屈永强 上官小荣 邹少权 《重庆理工大学学报(自然科学)》 CAS 北大核心 2023年第4期157-165,共9页
为提升高速公路交通事件检测效果,依据交通事件发生时上、下游交通流参数的变化特性,构建一组相对全面的交通事件检测初始特征变量集,使用随机森林-交叉验证递归特征消除(RF-RFECV)算法筛选出重要特征变量。利用重要特征变量作为输入训... 为提升高速公路交通事件检测效果,依据交通事件发生时上、下游交通流参数的变化特性,构建一组相对全面的交通事件检测初始特征变量集,使用随机森林-交叉验证递归特征消除(RF-RFECV)算法筛选出重要特征变量。利用重要特征变量作为输入训练长短期记忆网络(LSTM),通过贝叶斯优化算法(BOA)优化LSTM网络的超参数。使用真实高速公路数据进行验证和对比分析,采用Borderline-SMOTE解决交通数据集的不平衡问题。实验结果表明:筛选出对交通事件检测更为敏感的重要特征变量,可以提高检测精度,LSTM的检测效果也明显优于随机森林(RF)和支持向量机(SVM)。 展开更多
关键词 交通事件检测 特征变量选择 贝叶斯优化 长短期记忆网络
下载PDF
基于Elastic Net特征变量选择的SCR入口NO_(x)软测量模型 被引量:7
2
作者 王印松 陈瑞杰 《中国测试》 CAS 北大核心 2021年第12期79-86,共8页
在传统选择性催化还原反应器(selective catalytic reduction,SCR)入口NO_(x)软测量研究中,选取相关变量大多是基于机理分析方法,具有一定主观性。针对这一问题,提出Elastic Net方法结合最小二乘支持向量机(least squares support vecto... 在传统选择性催化还原反应器(selective catalytic reduction,SCR)入口NO_(x)软测量研究中,选取相关变量大多是基于机理分析方法,具有一定主观性。针对这一问题,提出Elastic Net方法结合最小二乘支持向量机(least squares support vector machine,LSSVM)的SCR入口NO_(x)软测量模型。首先采用Elastic Net对潜在相关变量进行变量选择,该方法无需机理分析,避免变量选择的主观性。此外,Elastic Net克服最小绝对收敛和选择算子(least absolute shrinkage and selection operator,LASSO)变量选择时因数据内部存在共线性和群组效应而影响选择效果的问题。然后利用LSSVM具有的训练速度较快、泛化性能优良和非线性逼近能力强等优点,建立Elastic Net-LSSVM软测量模型。现场数据仿真结果表明:Elastic Net-LSSVM与LSSVM相比,在预测时均方根误差减小8.45%,使预测更准确,验证软测量模型的有效性,可为烟气脱硝系统的控制优化提供参考。 展开更多
关键词 NO_(x)软测量 Elastic Net 特征变量选择 LSSVM
下载PDF
基于CART回归树的LIBS特征变量选择方法研究 被引量:3
3
作者 尤文 夏阳鹏 +2 位作者 黄玉涛 林京君 林晓梅 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2021年第10期3240-3244,共5页
激光诱导击穿光谱技术(LIBS)用于检测时,由于谱线多且复杂,存在许多冗余的信息,这些都会对定量分析造成影响。因此,提取有效的特征变量在LIBS的定量分析中具有非常重要的意义。对CaCl_(2)溶液中的Ca元素进行光谱特征选择方法分析,对比... 激光诱导击穿光谱技术(LIBS)用于检测时,由于谱线多且复杂,存在许多冗余的信息,这些都会对定量分析造成影响。因此,提取有效的特征变量在LIBS的定量分析中具有非常重要的意义。对CaCl_(2)溶液中的Ca元素进行光谱特征选择方法分析,对比单变量模型、偏最小二乘回归和CART回归树定标模型的准确度和稳定性。针对水体表面的波动性较大,光谱稳定性差,同时光谱受基体效应和自吸收效应影响等问题,首先采用单变量模型得到的拟合系数(R_(2))仅有0.9332,训练均方根误差(RMSEC)、预测均方根误差(RMSEP)和平均相对误差(ARE)分别为0.0192 Wt%,0.0177 Wt%和11.604%。经偏最小二乘回归优化后,模型R 2提高到0.9753,RMSEC,RMSEP和ARE分别降低到0.0108 Wt%,0.013 Wt%和7.49%。为了进一步提高定量分析的准确度,建立CART回归树定标模型。该方法在构建树模型时,通过平方误差最小化准则,从复杂的光谱信息中选取最优的特征变量组合做分类决策,从而建立Ca元素的定标曲线。通过CART回归树的变量选择,特征变量个数从100个减少到6个,变量的压缩率达到了94%,显著降低了无关谱线的干扰,回归树模型的相关系数R^(2),RMSEC,RMSEP和ARE分别为0.9975,0.0035 Wt%,0.0061 Wt%和2.500%。相较于传统的单变量模型与偏最小二乘回归,CART回归树模型具有更高的精度、更小的误差。通过对特征变量的有效筛选,剔除无关信号的干扰,显著降低了基体效应和自吸收效应对LIBS定量分析的影响,提高了定量分析的准确度和稳定性。 展开更多
关键词 激光诱导击穿光谱 特征变量选择 CART回归树 定量分析
下载PDF
基于Elastic Net特征变量选择的黄山毛峰茶等级评价 被引量:5
4
作者 潘天红 李鱼强 +1 位作者 陈琦 陈山 《农业工程学报》 EI CAS CSCD 北大核心 2020年第13期264-271,共8页
为简化茶叶化学检测分析过程,实现茶叶高精度等级评价,该研究以黄山毛峰茶为研究对象,结合茶叶中茶多酚、儿茶素、咖啡碱、没食子酸及氨基酸成分检测,提出基于Elastic Net特征变量选择的茶叶等级评价方法,建立基于特征成分的黄山毛峰茶... 为简化茶叶化学检测分析过程,实现茶叶高精度等级评价,该研究以黄山毛峰茶为研究对象,结合茶叶中茶多酚、儿茶素、咖啡碱、没食子酸及氨基酸成分检测,提出基于Elastic Net特征变量选择的茶叶等级评价方法,建立基于特征成分的黄山毛峰茶等级评价模型。试验选取6个不同等级共96个黄山毛峰茶叶样品,并分析了全部样品的19个成分,通过ElasticNet选取了9个特征成分(没食子酸、表儿茶素没食子酸酯、儿茶素、表儿茶素、没食子酸儿茶素没食子酸酯、表没食子儿茶素、谷氨酸、精氨酸和儿茶素苦涩味指数)建立等级评价模型,并与主成分分析(Principal Components Analysis,PCA)进行对比。100次蒙特卡罗试验结果表明,相比于PCA预测集准确率平均值为70.79%,基于Elastic Net特征变量选择的黄山毛峰茶等级评价准确率更高为78.72%。在此基础上,构建Elastic Net特征变量雷达图,实现黄山毛峰茶等级多变量综合评价可视化。研究结果表明所提方法可有效选择茶叶特征成分,提高黄山毛峰茶等级评价准确率,为茶叶高精度等级评价提供参考。 展开更多
关键词 模型 品质控制 Elastic Net 特征变量选择 黄山毛峰茶 等级评价
下载PDF
贪心算法的地理加权回归特征变量选择方法 被引量:3
5
作者 赵阳阳 刘纪平 +1 位作者 张福浩 仇阿根 《测绘科学》 CSCD 北大核心 2016年第7期41-46,共6页
针对建立地理加权回归(GWR)模型时,无法直接应用普通线性回归(OLR)常用的特征变量选择方法,且计算过程较复杂的问题,该文基于贪心算法原理,通过引入Akaike信息法则,设计了适用于GWR的特征变量选择方法:逐个引入或删除特征变量,判断该变... 针对建立地理加权回归(GWR)模型时,无法直接应用普通线性回归(OLR)常用的特征变量选择方法,且计算过程较复杂的问题,该文基于贪心算法原理,通过引入Akaike信息法则,设计了适用于GWR的特征变量选择方法:逐个引入或删除特征变量,判断该变量对模型置信水平影响程度,根据评价准则决定该变量的取舍,最终实现模型外没有关系强的变量、模型内没有关系弱的变量。实验结果表明,比较基于OLR的逐步回归、向前引入法和向后删除法3种方法选择变量建立模型,向前引入法优于向后剔除法,两者都优于基于OLR的逐步回归法,更适用于GWR分析。 展开更多
关键词 特征变量选择 地理加权回归 贪心算法 人口影响因素
原文传递
特征变量选择和回归方法相结合的土壤有机质含量估算 被引量:32
6
作者 李冠稳 高小红 +1 位作者 肖能文 肖云飞 《光学学报》 EI CAS CSCD 北大核心 2019年第9期361-371,共11页
针对高光谱数据量大、信息冗余严重的现象,应用稳定竞争性自适应重加权采样(sCARS)、连续投影算法(SPA)、遗传算法(GA)、迭代保留有效信息变量(IRIV)和稳定竞争性自适应重加权采样结合连续投影算法(sCARS-SPA),从全波段光谱数据中筛选... 针对高光谱数据量大、信息冗余严重的现象,应用稳定竞争性自适应重加权采样(sCARS)、连续投影算法(SPA)、遗传算法(GA)、迭代保留有效信息变量(IRIV)和稳定竞争性自适应重加权采样结合连续投影算法(sCARS-SPA),从全波段光谱数据中筛选特征变量,并利用全波段和特征波段建立偏最小二乘回归(PLSR)、支持向量机(SVM)和随机森林(RF)模型预测土壤有机质含量。结果表明, PLSR和SVM模型结合特征变量选择,不仅提高了模型运算效率,而且模型预测能力较全波段均有一定提高;RF模型采用特征变量建模,对模型精度的提高不是十分明显,但其构建模型的变量数量却显著减少,大大提高建模效率。RF模型精度优于SVM和PLSR模型,IRIV结合RF建立的土壤有机质含量预测模型,变量数仅63个,校准集和验证集模型决定系数(R2)分别为0.941和0.96,验证集相对分析误差(RPD)为4.8。与全波段建模相比,特征变量选择和回归方法相结合,在保证模型精度的同时,可有效提高建模效率。 展开更多
关键词 光谱学 土壤有机质含量 特征变量选择 回归模型
原文传递
用于装配动作识别的肌电信号特征优化选择方法 被引量:1
7
作者 刘永 宁蕊 +2 位作者 李言 杨明顺 高新勤 《西安理工大学学报》 北大核心 2023年第4期513-520,共8页
在采用机器学习方法进行动作识别的研究中,识别的准确率很大程度上取决于输入数据的特征。针对基于表面肌电信号的作业动作识别,进行了特征分析与优化选择方法研究。在对采集的作业手臂肌电信号进行平滑处理的基础上,定义并提取了肌电... 在采用机器学习方法进行动作识别的研究中,识别的准确率很大程度上取决于输入数据的特征。针对基于表面肌电信号的作业动作识别,进行了特征分析与优化选择方法研究。在对采集的作业手臂肌电信号进行平滑处理的基础上,定义并提取了肌电信号时域、频域及时频域的15个特征量;将从8个通道肌电信号的每帧数据中计算获得的120个特征值用于手势姿态的表征,并进行了归一化处理;使用极限梯度提升(XGBoost)算法和单变量特征选择(UFS)算法分别从特征量和特征值两个角度对所得信号特征进行识别贡献度的分析。分析结果表明,两种方法均可大幅消减冗余特征,并且能有效提高最终的识别准确率,其中采用UFS算法选取的特征在识别速度和准确度上更具优势。 展开更多
关键词 动作识别 表面肌电信号 特征选择 极限梯度提升算法 变量特征选择算法
下载PDF
基于二次互信息的特征选择算法
8
作者 李滔 王俊普 +1 位作者 王鹏伟 吴秀清 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第11期1133-1138,共6页
将二次互信息(mutual information)用作模式分类问题中特征选择的准则,分析了该准则在再生核希尔伯特空间中的几何意义.在二次互信息准则基础上,提出了基于Parzen窗密度估计和后向删除策略的特征选择算法PW-QMI,同时针对大规模数据集的... 将二次互信息(mutual information)用作模式分类问题中特征选择的准则,分析了该准则在再生核希尔伯特空间中的几何意义.在二次互信息准则基础上,提出了基于Parzen窗密度估计和后向删除策略的特征选择算法PW-QMI,同时针对大规模数据集的情况给出了基于高斯混合模型的算法GMM-QMI,以减小算法的计算复杂度.通过与相关度算法和SVM-RFE算法的实验比较,证明了该算法在特征选择问题上具有更为稳定的性能. 展开更多
关键词 二次互信息 特征变量选择 Parzen窗密度估计 高斯混合模型
下载PDF
基于AW-OPS高光谱波长选择方法的羊肉新鲜度检测
9
作者 赵停停 王克俭 +4 位作者 司永胜 淑英 何振学 王超 张志胜 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第3期830-837,共8页
高光谱数据中不仅含有关键性信息还存在一些干扰信息和无效信息,带有干扰信息和无效信息的数据建立模型会降低效率和模型精度。从全波段数据中提取特征波长是提高关系模型精度的有效方法。有序预测选择(OPS)是一种依据信息向量选择有效... 高光谱数据中不仅含有关键性信息还存在一些干扰信息和无效信息,带有干扰信息和无效信息的数据建立模型会降低效率和模型精度。从全波段数据中提取特征波长是提高关系模型精度的有效方法。有序预测选择(OPS)是一种依据信息向量选择有效波长变量的特征波长提取算法,在特征波长变量筛选方面表现了较好地性能。但由于建立模型时,没有去除重要性较低的变量,导致过多的无效变量参与到模型中,降低了模型的准确率。论文以羊肉高光谱数据作为研究对象,提出了一种改进的特征波长变量选择方法,基于信息向量和指数衰减函数的有序预测选择方法(AW-OPS)对羊肉新鲜度进行检测,该算法通过光谱数据和理化值数据之间的关系来计算信息向量并对波长变量进行排序,采用指数衰减函数(EDF)通过多次迭代去除一些信息向量绝对值比较低的波长变量,最后在已获取的有效波长变量中逐渐增加波长点建立多元回归模型,选取交叉均方根误差(RMSECV)最小值的波长变量子集为特征波长变量。实验时,将OPS法和AW-OPS法在选取特征波长变量后,分别构建羊肉TVB-N的偏最小二乘(PLS)关系模型,同时与全光谱波段PLS模型的效果相比较。结果表明:OPS算法运行程序平均用时为175.9 s,优选出370个特征波长变量,OPS-PLS模型相关系数(RP)平均为0.9631,均方根误差(RMSEP)平均为0.727;而改进的有序预测选择法(AW-OPS)运行程序平均用时为57.6 s,优选出275特征波长变量,AW-OPS-PLS模型平均提升到0.9731,RMSEP平均降低为0.5728;全光谱波长数目为1414个波长变量,其PLS模型的平均为0.9208,RMSEP平均为1.0483。AW-OPS-PLS模型相较于OPS-PLS模型测试精度提高了21.2%,相较于全光谱-PLS模型,测试精度提高了45%,证明AW-OPS是一种有效特征波长变量筛选方法,提高了OPS模型精度和程序运行效率,降低了模型复杂度。 展开更多
关键词 羊肉高光谱数据 信息向量 特征波长变量选择 AW-OPS法
下载PDF
蚁群算法在土壤速效磷近红外光谱波长选择中的应用 被引量:4
10
作者 张小鸣 冒智康 +2 位作者 李绍稳 金秀 朱正伟 《江苏农业科学》 2019年第19期227-231,共5页
光谱变量多、光谱信息易重叠、数据存在冗余且存在大量噪声,导致近红外光谱分析建模的时间长、模型的泛化能力不强、预测精度不高等问题。为此,提出了一种基于变量有效性精英蚁群系统(EAS)的波长选择算法,通过蚁群搜索选出特征波长。将... 光谱变量多、光谱信息易重叠、数据存在冗余且存在大量噪声,导致近红外光谱分析建模的时间长、模型的泛化能力不强、预测精度不高等问题。为此,提出了一种基于变量有效性精英蚁群系统(EAS)的波长选择算法,通过蚁群搜索选出特征波长。将变量有效性作为蚁群的初始信息素,在信息素更新过程中引入变量重要性投影方法,加快算法的收敛速度,避免陷入局部最优。为了验证算法的有效性,选取193个沙姜黑土土壤样本的近红外光谱数据为研究对象,采用变量有效性精英蚁群算法选择特征波长,构建土壤速效磷含量偏最小二乘回归预测模型,对全谱偏最小二乘模型、蚁群算法偏最小二乘模型进行比较研究。结果表明,采用变量有效性精英蚁群算法选出的特征波长建立的回归模型精度比普通蚁群算法选出的特征波长和全光谱高,建立回归模型更加简单。 展开更多
关键词 土壤速效磷 特征变量选择 蚁群算法 变量有效性 精英策略
下载PDF
单变量特征选择的苏北地区主要农作物遥感识别 被引量:57
11
作者 王娜 李强子 +3 位作者 杜鑫 张源 赵龙才 王红岩 《遥感学报》 EI CSCD 北大核心 2017年第4期519-530,共12页
遥感识别多源特征综合和特征优选是提高遥感影像分类精度的关键技术。农作物遥感识别中,识别特征的相对单一和数量过多均会导致作物识别精度不理想。随机森林(random forests)采用分类与回归树(CART)算法来生成分类树,结合了bagging和... 遥感识别多源特征综合和特征优选是提高遥感影像分类精度的关键技术。农作物遥感识别中,识别特征的相对单一和数量过多均会导致作物识别精度不理想。随机森林(random forests)采用分类与回归树(CART)算法来生成分类树,结合了bagging和随机选择特征变量的优点,是一种有效的分类方法。单变量特征选择(univariate feature selection)能够对每一个待分类的特征进行测试,衡量该特征和响应变量之间的关系,根据得分舍弃不好的特征,优选得到的特征用于分类。本文基于随机森林和单变量特征选择,利用多时相光谱信息、植被指数信息、纹理信息及波段差值信息,设计多组分类实验方案,对江苏省泗洪县的高分一号(GF-1)和环境一号(HJ-1A)影像进行分类研究,旨在选择最佳的分类方案对实验区主要农作物进行识别和提取。实验结果表明:(1)多源信息综合的农作物分类精度明显高于单一的原始光谱特征分类,说明不同类型特征的引入能改善分类效果;(2)基于单变量特征选择算法的优选特征分类效果最佳,总体精度97.07%,Kappa系数0.96,表明了特征优选在降低维度的同时,也保证了较高的分类精度。随机森林和单变量特征选择结合的方法可以提高遥感影像的分类精度,为农作物的识别和提取研究提供了有效的方法。 展开更多
关键词 变量特征选择 光谱特征 植被指数特征 纹理特征 波段差值特征
原文传递
基于多目标进化算法的高维模糊分类系统的设计 被引量:11
12
作者 张永 吴晓蓓 +1 位作者 向峥嵘 胡维礼 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第1期210-215,共6页
提出一种可同时构造多个精确性和解释性较好折中的高维模糊分类系统的设计方法。该方法由以下三步组成:(1)利用Simba算法进行特征变量选择;(2)采用模糊聚类算法辨识初始的模糊模型;(3)利用匹茨堡型实数编码的多目标遗传算法对初始模糊... 提出一种可同时构造多个精确性和解释性较好折中的高维模糊分类系统的设计方法。该方法由以下三步组成:(1)利用Simba算法进行特征变量选择;(2)采用模糊聚类算法辨识初始的模糊模型;(3)利用匹茨堡型实数编码的多目标遗传算法对初始模糊模型的结构和参数进行学习。基于NSGA-Ⅱ算法的目标函数同时考虑模型的精确性和解释性;为提高模型的解释性,在多目标进化算法中利用基于相似性的模型简化方法对模型进行约简。利用该方法对Wine等问题进行分类,仿真结果验证了方法的有效性。 展开更多
关键词 模糊分类系统 特征变量选择 模糊聚类 PARETO最优解 遗传算法 解释性
下载PDF
基于多目标遗传算法的模糊分类系统设计 被引量:7
13
作者 邢宗义 侯远龙 贾利民 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第5期725-731,共7页
提出了一种基于多目标遗传算法的模糊建模方法,实现了具备最大分类精度、最少特征变量和模糊规则数目的模糊分类系统的设计.首先,为缓解维数灾难问题,采用多目标遗传算法进行特征变量的选择和论域的模糊划分,构造基于栅格划分的初始模... 提出了一种基于多目标遗传算法的模糊建模方法,实现了具备最大分类精度、最少特征变量和模糊规则数目的模糊分类系统的设计.首先,为缓解维数灾难问题,采用多目标遗传算法进行特征变量的选择和论域的模糊划分,构造基于栅格划分的初始模糊分类系统.然后为减少规则数目,提高模糊系统的解释性,采用遗传算法进行规则选择,得到具备较少规则数目的精简模糊分类系统.最后为提高精确性,采用约束遗传算法对精简模糊分类系统进行整体优化,在解释性不变的前提下,提高模糊分类系统的精确性.Iris和W ine分类系统的仿真,验证了该方法的有效性. 展开更多
关键词 模糊分类系统 多目标遗传算法 特征变量选择 模糊划分
下载PDF
复杂模糊分类系统的协同进化设计方法 被引量:3
14
作者 张永 吴晓蓓 +1 位作者 向峥嵘 胡维礼 《控制理论与应用》 EI CAS CSCD 北大核心 2007年第1期32-38,共7页
提出一种基于协同进化算法的复杂模糊分类系统的设计方法.该方法由以下3步组成:1)利用Simba算法进行特征变量选择;2)采用模糊聚类算法辨识初始的模糊模型;3)利用协同进化算法对所获得的初始模糊模型进行结构和参数的优化.协同进化算... 提出一种基于协同进化算法的复杂模糊分类系统的设计方法.该方法由以下3步组成:1)利用Simba算法进行特征变量选择;2)采用模糊聚类算法辨识初始的模糊模型;3)利用协同进化算法对所获得的初始模糊模型进行结构和参数的优化.协同进化算法由三类种群组成;规则数种群,规则前件种群和隶属函数种群;其适应度函数同时考虑模型的精确性和解释性,采用三类种群合作计算的策略.利用该方法对多个典型问题进行分类,仿真结果验证了方法的有效性. 展开更多
关键词 模糊分类系统 特征变量选择 协同进化算法 解释性
下载PDF
基于MEG虚相干功能连接的阅读理解能力预测模型的研究
15
作者 赵力敏 相洁 +1 位作者 王彬 武淑红 《太原理工大学学报》 CAS 北大核心 2023年第5期796-803,共8页
【目的】阅读理解是人类最重要的认知能力,评价人类的阅读理解能力需要客观指标。【方法】提出一种基于脑磁图(magnetoencephalogram, MEG)虚相干脑功能连接的预测模型,使用虚相干算法构建全脑MEG功能连接,并通过单变量特征选择算法对... 【目的】阅读理解是人类最重要的认知能力,评价人类的阅读理解能力需要客观指标。【方法】提出一种基于脑磁图(magnetoencephalogram, MEG)虚相干脑功能连接的预测模型,使用虚相干算法构建全脑MEG功能连接,并通过单变量特征选择算法对特征进行选择,采用偏最小二乘回归(Partial Least Squares, PLS)构建预测模型对阅读理解能力进行预测。【结果】基于MEG虚相干功能连接的偏最小二乘回归模型可以成功预测阅读理解分数;进行单变量特征选择的模型预测性能更高、预测更准确(R^(2)[PVT-Language]=0.524,MSE[PVT-Language]=5.042;R^(2)[ORRT-Language]=0.536,MSE[ORRT-Language]=5.142),并且发现采用与阅读理解相关的任务态数据集比静息态数据集更适合用来预测阅读理解能力,且特征选择的功能连接更精确。【结论】基于MEG虚相干功能连接的PLS预测模型可以用来客观评价人类阅读理解能力。 展开更多
关键词 阅读理解能力 预测模型 偏最小二乘 任务态脑磁图 变量特征选择 虚相干算法
下载PDF
基于随机森林回归的煤矿瓦斯涌出量预测方法 被引量:20
16
作者 吴奉亮 霍源 高佳南 《工矿自动化》 北大核心 2021年第8期102-107,共6页
为了提高煤矿瓦斯涌出量预测精度和效率,研究了基于随机森林回归的煤矿瓦斯涌出量预测方法。采用bootstrap自助法重采样技术采集训练样本数据,构建随机森林回归模型,取决策树输出值的均值作为煤矿瓦斯涌出量预测结果,利用袋外数据评价... 为了提高煤矿瓦斯涌出量预测精度和效率,研究了基于随机森林回归的煤矿瓦斯涌出量预测方法。采用bootstrap自助法重采样技术采集训练样本数据,构建随机森林回归模型,取决策树输出值的均值作为煤矿瓦斯涌出量预测结果,利用袋外数据评价回归模型预测性能。通过计算袋外数据残差平方均值和拟合优度,确定随机森林回归模型的最优超参数;采用袋外数据残差平方均值的增加量来表征特征变量的重要性,用累计影响权重达到90%的部分特征变量代替煤矿瓦斯涌出量的全部特征变量,筛选出采煤高度、煤厚、煤层瓦斯含量、采出率、埋深、日进度、开采强度、邻近层间距8个重要程度高的特征变量作为模型的输入变量。测试结果表明,采用全部特征变量和部分特征变量的随机森林回归模型均具有较好的预测性能,进行特征变量选择后,模型的平均绝对误差由0.22 m^(3)/min下降到0.21 m^(3)/min,平均相对误差由3.55%下降到3.47%。基于特征变量选择的随机森林回归模型在保证较好的预测性能的前提下,降低了预测模型特征变量的维度,减少了原始数据获取工作,提高了预测效率。 展开更多
关键词 瓦斯涌出量预测 随机森林回归 超参数寻优 特征变量选择 影响权重
下载PDF
SiPLS-CARS与GA-ELM对哈密瓜冠层叶片含水率的反演估测 被引量:4
17
作者 郭阳 郭俊先 +3 位作者 史勇 李雪莲 黄华 刘彦岑 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2022年第8期2565-2571,共7页
传统的叶片含水率检测方法效率低、操作繁琐且是有损的检测,不利于大田哈密瓜叶片含水率的快速获取。为实现对大田哈密瓜生长期进行更精细的田间灌水管理,利用光谱技术分别获取了哈密瓜植株在成长期(M)、开花期(M)、结果期(M)、成熟期(M... 传统的叶片含水率检测方法效率低、操作繁琐且是有损的检测,不利于大田哈密瓜叶片含水率的快速获取。为实现对大田哈密瓜生长期进行更精细的田间灌水管理,利用光谱技术分别获取了哈密瓜植株在成长期(M)、开花期(M)、结果期(M)、成熟期(M)四个时期内的冠层叶片样本,采用烘干法测得叶片样本的含水率。为提高预测模型的精度和稳定性,首先开展并讨论极限学习机(ELM)模型中的核函数与隐含层神经元个数的选择对ELM模型精度的影响。随后分别利用联合子区间偏最小二乘法(SiPLS)及其与竞争性自适应重加权采样法(CARS)、遗传算法(GA)、连续投影算法(SPA)的组合算法对全波段光谱数据中与叶片含水率相关性高的特征波长进行筛选提取。再分别使用GA与粒子群算法(PSO)对已经确定最佳核函数与隐含层神经元个数的ELM模型中的输入层与隐含层间的连接权值(W)和隐含层神经元阈值(B)进行优化选择,获取最优且稳定的W与B值,进一步提高模型的稳定性和预测精度。最后将四种特征波长提取算法优选出的特征波长分别进行ELM,GA-ELM,PSO-ELM建模分析,以校正集和预测集的相关系数R与R为模型评价指标,经过对比分析优选出能准确预测哈密瓜冠层叶片含水率的反演估测模型。采用SiPLS及其与CARS,GA和SPA的组合算法提取特征波长,筛选出的变量数分别为273,20,32和6,占全光谱变量的15.6%,1.2%,1.9%和0.03%。进一步将筛选出的特征波长作为自变量,叶片的含水率作为因变量,建立了ELM的预测模型,最佳预测精度R值为0.8450,预测精度不是很理想。故引入GA与PSO对ELM中随机产生的W与B值进行优化选择。最终,经过研究发现,利用GA优化后的ELM模型结合SiPLS-CARS筛选出的特征波长建立的哈密瓜冠层叶片含水率预测精度最优,故反演叶片含水率的最优建模方式为SiPLS-CARS-GA-ELM,R值为0.9289,R值为0.9032,所建模型精度较高,可为大田哈密瓜冠层叶片的含水率进行快速检测,为田间灌溉管理提供科学依据。 展开更多
关键词 哈密瓜叶片含水率 模型优化 特征变量选择 遗传算法 粒子群算法 ELM模型
下载PDF
基于拉曼光谱荧光背景的痕量原油泄漏检测方法 被引量:1
18
作者 童宗歌 陈夕松 +1 位作者 王鹏 胡云云 《石油炼制与化工》 CAS CSCD 北大核心 2022年第4期108-113,共6页
炼化企业在原油和常压蒸馏塔侧线轻质油换热过程中存在原油泄漏问题,进而对安全生产和后续加工环节质量控制造成不利影响。利用拉曼光谱荧光背景对原油敏感的特点,可以实现轻质油中痕量原油的检测。扫描90个含有痕量原油的常压蒸馏塔塔... 炼化企业在原油和常压蒸馏塔侧线轻质油换热过程中存在原油泄漏问题,进而对安全生产和后续加工环节质量控制造成不利影响。利用拉曼光谱荧光背景对原油敏感的特点,可以实现轻质油中痕量原油的检测。扫描90个含有痕量原油的常压蒸馏塔塔顶石脑油样本拉曼光谱作为试验数据,采用偏最小二乘回归法结合遗传算法、随机蛙跳算法以及竞争自适应重加权采样算法建模。其中检测效果最好的是竞争自适应重加权采样算法与偏最小二乘法结合的方法,预测均方根误差为1.5674μg/g。该研究表明使用拉曼光谱荧光背景进行轻质油痕量原油检测,在算法优化后可以精确检测到质量分数1~100μg/g的痕量原油,满足炼化企业生产要求。 展开更多
关键词 拉曼光谱 荧光背景 痕量原油 特征变量选择 偏最小二乘回归
下载PDF
结构健康监测系统的数据异常识别 被引量:3
19
作者 范时枭 张金辉 张其林 《计算机辅助工程》 2016年第5期60-65,共6页
结合机器学习方法对结构健康监测系统采集的原始数据进行初步的自动化分析,以达到降低进一步分析的计算量、提高分析子系统精度的目的.以上海中心和兰州西站监测系统为背景,利用机器学习方法研究数据异常识别问题,优化数据分析预警子系... 结合机器学习方法对结构健康监测系统采集的原始数据进行初步的自动化分析,以达到降低进一步分析的计算量、提高分析子系统精度的目的.以上海中心和兰州西站监测系统为背景,利用机器学习方法研究数据异常识别问题,优化数据分析预警子系统.使用单变量特征选择提取利于识别的特征向量,对比分析在结构健康监测中各类支持向量机(Support Vector Machine,SVM)的优劣,组合利用不同SVM的优势减少异常数据的漏报和误报.该方法已被应用于上海中心和兰州西站的结构健康监测系统中. 展开更多
关键词 结构健康监测 数据识别 变量特征选择 支持向量机 主成分分析 机器学习 数据降维
下载PDF
Accelerated Recursive Feature Elimination Based on Support Vector Machine for Key Variable Identification 被引量:4
20
作者 毛勇 皮道映 +1 位作者 刘育明 孙优贤 《Chinese Journal of Chemical Engineering》 SCIE EI CAS CSCD 2006年第1期65-72,共8页
Key variable identification for classifications is related to many trouble-shooting problems in process indus-tries. Recursive feature elimination based on support vector machine (SVM-RFE) has been proposed recently i... Key variable identification for classifications is related to many trouble-shooting problems in process indus-tries. Recursive feature elimination based on support vector machine (SVM-RFE) has been proposed recently in applica-tion for feature selection in cancer diagnosis. In this paper, SVM-RFE is used to the key variable selection in fault diag-nosis, and an accelerated SVM-RFE procedure based on heuristic criterion is proposed. The data from Tennessee East-man process (TEP) simulator is used to evaluate the effectiveness of the key variable selection using accelerated SVM-RFE (A-SVM-RFE). A-SVM-RFE integrates computational rate and algorithm effectiveness into a consistent framework. It not only can correctly identify the key variables, but also has very good computational rate. In comparison with contribution charts combined with principal component aralysis (PCA) and other two SVM-RFE algorithms, A-SVM-RFE performs better. It is more fitting for industrial application. 展开更多
关键词 variable selection support vector machine recursive feature elimination fault diagnosis
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部