期刊文献+
共找到235篇文章
< 1 2 12 >
每页显示 20 50 100
基于敏感变量筛选的多光谱植被含水率反演模型研究
1
作者 赵文举 段威成 +2 位作者 王银凤 周春 马宏 《农业机械学报》 EI CAS CSCD 北大核心 2023年第9期343-351,385,共10页
植被含水率是农田生态系统敏感性的重要表征,为提高近地遥感植被含水率反演效率和精度,基于无人机多光谱影像数据,提取苜蓿、玉米2种植被覆盖的光谱反射率,在此基础上引入红边波段计算改进光谱指数。将5种光谱反射率及25个光谱指数利用... 植被含水率是农田生态系统敏感性的重要表征,为提高近地遥感植被含水率反演效率和精度,基于无人机多光谱影像数据,提取苜蓿、玉米2种植被覆盖的光谱反射率,在此基础上引入红边波段计算改进光谱指数。将5种光谱反射率及25个光谱指数利用变量投影重要性(Variable importance in projection, VIP)分析、灰色关联度(Gray relational analysis, GRA)分析与皮尔逊(Person)相关性分析进行筛选,并建立基于反向神经网络(Back-propagation neural network, BPNN)、偏最小二乘法(Partial least squares regression, PLSR)、支持向量回归(Support vector regression, SVR)和随机森林(Random forest, RF)4种机器学习模型,以确定不同作物覆盖下的最佳植被含水率反演模型。结果表明,3种筛选算法中VIP和GRA的模型精度明显优于Person相关性分析,且反演结果波动较小;在4种机器学习算法中,SVR算法在非线性问题中相较于BPNN、PLSR、RF算法具有较强的解析能力和模型鲁棒性,验证集决定系数R~2达到0.77以上,其结果能较真实反映植被含水率;两种样地基于GRA的植被含水率反演模型精度最高,苜蓿覆盖地GRA-SVR验证集R~2达0.889,RMSE为0.798%,MAE为0.533%;玉米覆盖地反演结果验证集R~2为0.848,RMSE为0.668%,MAE为0.542%。研究结果可为植被含水率的快速、精准反演提供理论依据。 展开更多
关键词 植被含水率 无人机多光谱 光谱指数 变量筛选 反演模型
下载PDF
基于Shapley值的分类预测模型变量筛选方法改进
2
作者 聂茜 邓光明 《统计与决策》 北大核心 2023年第3期38-42,共5页
在分类预测模型的自变量间存在交互效应时,传统Shapley值法的可加性无法满足,造成变量筛选效果变差,导致分类模型的预测精度降低。针对此问题,文章提出使用稳健独立成分分析,从原始数据中估计出具有独立性的数据集并对其进行Shapley值分... 在分类预测模型的自变量间存在交互效应时,传统Shapley值法的可加性无法满足,造成变量筛选效果变差,导致分类模型的预测精度降低。针对此问题,文章提出使用稳健独立成分分析,从原始数据中估计出具有独立性的数据集并对其进行Shapley值分解,从而提高变量筛选的准确度。统计模拟与实证分析的结果表明,改进后的方法在变量筛选上的表现优于传统Shapley值法。 展开更多
关键词 分类预测模型 变量筛选 SHAPLEY值法 稳健独立成分分析
下载PDF
分类先验特征选择算法在代谢组学数据变量筛选中的应用
3
作者 王娅妮 杜丽晶 +1 位作者 郭拓 肖雪 《分析测试学报》 CAS CSCD 北大核心 2023年第4期423-431,共9页
该文提出了基于无监督判别投影特征选择的支持向量机方法(UDPFS-SVM)用于标志物筛选。UDPFS-SVM首先通过无监督判别投影算法(UDPFS)引入分类先验信息、添加正则化与惩罚函数等约束自适应地获得具有稀疏性的判别投影矩阵,然后根据获得的... 该文提出了基于无监督判别投影特征选择的支持向量机方法(UDPFS-SVM)用于标志物筛选。UDPFS-SVM首先通过无监督判别投影算法(UDPFS)引入分类先验信息、添加正则化与惩罚函数等约束自适应地获得具有稀疏性的判别投影矩阵,然后根据获得的矩阵求得相应低维代谢矩阵,最后建立支持向量机(SVM)分类模型寻找生物标志物。所提出的方法能够同时进行模糊学习与稀疏学习,并可合理利用变量之间的依赖关系。通过UDPFS-SVM与偏最小二乘判别分析(PLS-DA)方法对高脂血症大鼠血浆代谢组学数据进行变量筛选,并采用方差分析、ROC曲线、线性判别分析(LDA)对筛选得到的生物标志物进行评价。结果表明,两种方法均发现8个生物标志物。方差分析显示UDPFS-SVM方法获得的生物标志物均具有显著性差异,且显著性差异值均大于PLS-DA;ROC结果显示UDPFS-SVM结果为1.00,比PLS-DA结果高0.05;LDA显示UDPFS-SVM获得的生物标志物在高脂血症样本中可以更好地消除组内代谢差异,区分组间代谢差异,说明UDPFS-SVM方法在高脂血症生物标志物发现上优于PLS-DA,为生物标志物的发现提供了一种新思路。 展开更多
关键词 变量筛选 无监督判别投影 分类先验信息 非线性 高维小样本 代谢组学
下载PDF
结合主成分与熵权的关键变量筛选算法
4
作者 岳喜超 王勇 +1 位作者 陈乐 王超群 《中国电子科学研究院学报》 北大核心 2023年第7期671-679,共9页
传统的基于主成分的冗余变量筛选算法最终计算所得的关键变量筛选指标需要结合专家经验进行判定,具有人为主观性,使得模型预测结果不稳定。因此,文中提出了一种结合主成分与熵权的关键变量筛选算法(Key Variable Screening Algorithm Co... 传统的基于主成分的冗余变量筛选算法最终计算所得的关键变量筛选指标需要结合专家经验进行判定,具有人为主观性,使得模型预测结果不稳定。因此,文中提出了一种结合主成分与熵权的关键变量筛选算法(Key Variable Screening Algorithm Combining Principal Component and Entropy Weight,KVSA-PCA-EP)。该算法,首先通过传统的基于主成分的冗余变量筛选算法计算第一个关键变量筛选指标;然后,通过各原始变量的方差和目标变量的熵值计算第二个关键变量筛选指标;最后,以第二个关键变量筛选指标与第一个关键变量筛选指标的比值作为最终的关键变量筛选指标。文中通过在公开数据集METERC上的实验,并与传统的基于主成分的冗余变量筛选算法作对比,F1分数方面提高约5%,充分验证了提出算法的优越性。 展开更多
关键词 特征工程 特征选择 相关系数 主成分分析 变量筛选 熵权法
下载PDF
基于UVE变量筛选偏最小二乘的LIBS磷精矿浆定量分析
5
作者 房胜楠 史烨弘 +2 位作者 韩鹏程 赵振 李华昌 《矿冶》 CAS 2023年第1期109-114,共6页
利用激光诱导击穿光谱(Laser Induced Breakdown Spectroscopy, LIBS)技术采集得到磷精矿浆的光谱,基于无信息变量消除(Uniformative Variables Elimination, UVE)方法筛选出与磷元素相关的波长变量,将选择后的波长作为自变量建立偏最... 利用激光诱导击穿光谱(Laser Induced Breakdown Spectroscopy, LIBS)技术采集得到磷精矿浆的光谱,基于无信息变量消除(Uniformative Variables Elimination, UVE)方法筛选出与磷元素相关的波长变量,将选择后的波长作为自变量建立偏最小二乘(Partial Least Squares, PLS)回归模型,并与传统全谱PLS和GA-PLS(Genetic Algorithm-Partial Least Squares, GA-PLS)定标模型进行比较。相比全谱PLS,UVE-PLS定标模型的性能更优,其预测均方根误差(Root-mean-square Error of Prediction, RMSEP)由0.38%下降到0.26%,决定系数(R2)从0.59提高到0.72。相比GA-PLS定标模型,UVE方法可以克服GA(Genetic Algorithm, GA)在参量选择上存在随机性的弊端,筛选出的变量仅为全谱的8.76%,而且计算速度更快,分析精度也优于GA-PLS模型。 展开更多
关键词 激光诱导击穿光谱(LIBS) 无信息变量消除(UVE) 偏最小二乘法(PLS) 磷矿浆 变量筛选
下载PDF
基于变量筛选方法的农业发展影响研究——以湘西州为例
6
作者 曾汉勇 郭兵 +1 位作者 李赛凤 韦敏良 《河北农机》 2023年第2期96-98,共3页
目前,全国的“三农”工作是一项很重要的工作,对湘西州的农业发展进行综合性评价具有非常重要的实际意义。首先基于湘西州近五年以来的农业发展相关数据,先利用基于Gram-Schmidt变换的主基底分析对每一年的变量进行初始变量的筛选,并在... 目前,全国的“三农”工作是一项很重要的工作,对湘西州的农业发展进行综合性评价具有非常重要的实际意义。首先基于湘西州近五年以来的农业发展相关数据,先利用基于Gram-Schmidt变换的主基底分析对每一年的变量进行初始变量的筛选,并在此初始变量集合的基础上,通过主成分析法分析七县一市之间每年的农业发展能力差异,有针对性地提出一些建议来提升部分落后县市的农业发展能力。 展开更多
关键词 农业发展 变量筛选 主成分分析
下载PDF
近红外光谱变量筛选提高西瓜糖度预测模型精度 被引量:40
7
作者 介邓飞 谢丽娟 +1 位作者 饶秀勤 应义斌 《农业工程学报》 EI CAS CSCD 北大核心 2013年第12期264-270,共7页
水果的内部品质是水果分级、保鲜及存储的一项重要指标,利用近红外光谱技术对西瓜内部品质进行快速无损检测研究有着非常重要的意义。为了研究变量筛选方法对西瓜糖度预测模型精度的影响,该文以麒麟瓜为研究对象,利用近红外漫透射光谱... 水果的内部品质是水果分级、保鲜及存储的一项重要指标,利用近红外光谱技术对西瓜内部品质进行快速无损检测研究有着非常重要的意义。为了研究变量筛选方法对西瓜糖度预测模型精度的影响,该文以麒麟瓜为研究对象,利用近红外漫透射光谱技术对麒麟瓜可溶性固形物含量(SSC)进行检测,采用偏最小二乘回归(PLSR),多元线性回归(MLR)和主成分回归(PCR)建立麒麟瓜可溶性固形物数学模型,并探讨等间隔平均光谱和等间隔抽取光谱变量筛选结合连续投影算法(SPA)对预测模型精度的影响。研究结果表明:光谱经等间隔抽取(间隔5,115个变量)经归一化预处理,结合SPA优选出6个波长建立的PLSR预测模型的相关系数(rpre)为0.828、校正均方根误差(RMSEC)为0.589、预测均方根误差(RMSEP)为0.611。该模型预测效果相对较优,建模时间短,提高了模型的预测能力和预测精度。该研究为西瓜内部品质的在线无损检测提供研究基础。 展开更多
关键词 近红外光谱 模型 无损检测 西瓜 可溶性固形物 变量筛选 漫透射
下载PDF
近红外光谱结合CARS变量筛选方法用于液态奶中蛋白质与脂肪含量的测定 被引量:51
8
作者 张华秀 李晓宁 +2 位作者 范伟 梁逸曾 唐玉莲 《分析测试学报》 CAS CSCD 北大核心 2010年第5期430-434,共5页
采用CARS(Competitive adaptive reweighted sampling)变量筛选方法建模,显著提高了液态奶中蛋白质与脂肪近红外模型的预测精度。用蒙特卡罗采样(Monte-Carlo sampling)方法先剔除奇异样本,再对光谱进行中心化与Karl Norris滤波降噪处理... 采用CARS(Competitive adaptive reweighted sampling)变量筛选方法建模,显著提高了液态奶中蛋白质与脂肪近红外模型的预测精度。用蒙特卡罗采样(Monte-Carlo sampling)方法先剔除奇异样本,再对光谱进行中心化与Karl Norris滤波降噪处理,通过CARS方法筛选出与样本性质密切相关的变量,建立预测蛋白质与脂肪含量的偏最小二乘法(PLS)校正模型,并与未选变量的PLS模型进行比较。以定标集相关系数(r2)及交互验证均方残差(RMSECV)和预测误差均方根(RMSEP)作为判定依据,确定了蛋白质与脂肪的最佳建模条件。蛋白质与脂肪校正模型的相关系数分别为0.975 0、0.995 1,RMSECV分别为0.194 8、0.136 3,RMSEP分别为0.113 3、0.140 1,预测结果优于未选变量的PLS模型及其他选变量方法,有效简化了模型,适于液态奶中脂肪和蛋白质的快速、无损检测。 展开更多
关键词 近红外光谱 液态奶 偏最小二乘法 CARS变量筛选
下载PDF
遗传算法用于偏最小二乘方法建模中的变量筛选 被引量:46
9
作者 褚小立 袁洪福 +1 位作者 王艳斌 陆婉珍 《分析化学》 SCIE EI CAS CSCD 北大核心 2001年第4期437-442,共6页
利用全局搜索方法─—遗传算法(genetic algorithms, GA)对近红外光谱快速分析中的波长变量进行筛选,再用偏最小二乘方法(partial least squares, PLS)建立分析校正模型。对两类... 利用全局搜索方法─—遗传算法(genetic algorithms, GA)对近红外光谱快速分析中的波长变量进行筛选,再用偏最小二乘方法(partial least squares, PLS)建立分析校正模型。对两类样品的近红外光谱分析应用实例表明,这种选取变量进行校正的方法,不仅简化、优化了模型,而且增强了所建模型的预测能力,尤其适用于单纯PLS较难校正关联的体系。 展开更多
关键词 遗传算法 偏最小二乘方法 变量筛选 汽油 芳烃 润滑油 饱和烃 近红外光谱分析 波长筛选
下载PDF
近红外光谱结合特征变量筛选方法测定茶汤中的氨基酸含量 被引量:11
10
作者 吴彦红 艾施荣 +2 位作者 严霖元 杨红飞 胡琪 《江西农业大学学报》 CAS CSCD 北大核心 2012年第5期1026-1031,共6页
采用透射方式获取茶汤的近红外光谱,利用特征变量筛选方法从茶汤的近红外光谱中提取氨基酸光谱信息,建立茶汤中氨基酸含量的快速检测模型。分别利用间隔偏最小二乘法(iPLS)和联合区间偏最小二乘法(siPLS)从茶汤的近红外光谱中提取微弱... 采用透射方式获取茶汤的近红外光谱,利用特征变量筛选方法从茶汤的近红外光谱中提取氨基酸光谱信息,建立茶汤中氨基酸含量的快速检测模型。分别利用间隔偏最小二乘法(iPLS)和联合区间偏最小二乘法(siPLS)从茶汤的近红外光谱中提取微弱的氨基酸信息,建立其近红外光谱定量分析模型。结果表明,利用两种方法筛选的特征变量都避开了水的强吸收峰影响,但利用siPLS方法建立的模型性能明显好于iPLS的。最优的siPLS模型对校正集样本的相关系数为0.912,交互验证均方根误差为0.185;用预测集中独立样本检验模型性能,其相关系数为0.887,预测均方根误差为0.202。研究结果可为液体茶饮料中的成分实时快速检测提供参考。 展开更多
关键词 茶汤 氨基酸 近红外光谱 特征变量筛选
下载PDF
激光诱导击穿光谱检测青菜中镉元素的多变量筛选研究 被引量:7
11
作者 杨晖 黄林 +3 位作者 刘木华 陈添兵 王彩虹 姚明印 《分析化学》 SCIE EI CAS CSCD 北大核心 2017年第2期238-244,共7页
利用激光诱导击穿光谱(LIBS)技术与常规化学分析方法获取28个浓度梯度含Cd元素的青菜样品的LIBS谱线信息以及Cd含量信息。对获取的光谱信息结合标准归一化处理(SNV)、一阶导数(FD)、二阶导数(SD)、中心化处理(Center)作为偏最小二乘法(P... 利用激光诱导击穿光谱(LIBS)技术与常规化学分析方法获取28个浓度梯度含Cd元素的青菜样品的LIBS谱线信息以及Cd含量信息。对获取的光谱信息结合标准归一化处理(SNV)、一阶导数(FD)、二阶导数(SD)、中心化处理(Center)作为偏最小二乘法(PLS)模型的优选方法;再根据4种预处理方法的预测结果选取最佳方法,同时将该方法作为间隔偏最小二乘法(iPLS)与联合区间间隔偏最小二乘法(Si PLS)优选青菜LIBS谱线的最佳波长区间。结果表明:通过Si PLS优选的特征波长区间分别为214.72~215.82 nm,215.88~216.97 nm,225.08~226.35 nm,并且经过中心化预处理后建立的验证模型效果最好,结果显示交叉验证均方根误差(RMSECV)为1.487,验证均方根误差(RMSEP)为1.094,相关系数(R)为0.9942,平均相对误差(ARE)为11.60%。研究结果表明,所选优化方法适合青菜中重金属Cd元素的LIBS校正模型的建立,且具有较好的预测效果。 展开更多
关键词 激光诱导击穿光谱 青菜 变量筛选
下载PDF
基于主基底分析的变量筛选 被引量:18
12
作者 王惠文 仪彬 叶明 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2008年第11期1288-1291,共4页
利用Gram-Schmidt变换,提出一种主基底分析方法.解释并证明了Gram-Schmidt变换所删除的信息量.给出"主基底"的定义及构造方法,并提出"净信息含量比"的概念,用以测度所选基底包含的信息.该方法能在原始数据信息损失... 利用Gram-Schmidt变换,提出一种主基底分析方法.解释并证明了Gram-Schmidt变换所删除的信息量.给出"主基底"的定义及构造方法,并提出"净信息含量比"的概念,用以测度所选基底包含的信息.该方法能在原始数据信息损失尽可能小的前提下,排除所有的冗余变量以及变量集合中的重叠信息,得到一个正交的主基底,从而更有效地对大规模变量集合中的信息进行筛选.多角度的理论分析指出,主基底在尽可能多地携带原始变量信息的同时,还可保证样本点间的相似性改变最小.实际案例分析说明了该方法的合理性和有效性. 展开更多
关键词 Gram—Schmidt变换 变量筛选 数据降维 主基底
下载PDF
遗传算法用于变量筛选 被引量:7
13
作者 章元 朱尔一 +1 位作者 庄峙厦 王小如 《高等学校化学学报》 SCIE EI CAS CSCD 北大核心 1999年第9期1371-1375,共5页
利用遗传算法的优越搜索寻优特性,结合有序Gram-Schmidt正文化及PLS算法可得到预报能力较强的模型,即PRESS(预报残差平方和)值较低的模型.该法可用于处理构效关系及人发微量元素与性别关系问题,并与正交递归选择法及逐步回归正... 利用遗传算法的优越搜索寻优特性,结合有序Gram-Schmidt正文化及PLS算法可得到预报能力较强的模型,即PRESS(预报残差平方和)值较低的模型.该法可用于处理构效关系及人发微量元素与性别关系问题,并与正交递归选择法及逐步回归正向选择法进行比较,结果良好. 展开更多
关键词 遗传算法 PLC回归 变量筛选 分析化学 数据处理
下载PDF
偏最小二乘变量筛选法在毒品来源分析中的应用 被引量:8
14
作者 朱尔一 林燕 庄赞勇 《分析化学》 SCIE EI CAS CSCD 北大核心 2007年第7期973-977,共5页
提出了一种新的偏最小二乘变量筛选方法,该方法利用PLS回归建模过程中的一些信息,删除一部分冗余的或对建模影响不大的变量来简化、优化预报模型。用此方法结合变量扩维方法处理云南昆明、思茅、西双版纳3个来源地缴获的244个海洛因样本... 提出了一种新的偏最小二乘变量筛选方法,该方法利用PLS回归建模过程中的一些信息,删除一部分冗余的或对建模影响不大的变量来简化、优化预报模型。用此方法结合变量扩维方法处理云南昆明、思茅、西双版纳3个来源地缴获的244个海洛因样本的ICP-MS数据时,与传统的算法比较,模型的判别准确率得到大大提高,达到95%以上。且所得到的模型含变量少,很容易分析或解释各变量对模型的影响。因此该方法可用于对毒品来源有效的识别或鉴定。 展开更多
关键词 偏最小二乘 变量筛选 毒品来源分析 分类模型
下载PDF
小波网络平均影响值的航空发动机自变量筛选 被引量:6
15
作者 崔智全 付旭云 +1 位作者 钟诗胜 王体春 《计算机集成制造系统》 EI CSCD 北大核心 2013年第12期3062-3067,共6页
为了快速准确地实现发动机参数非线性自变量筛选,基于平均影响值的思想和小波神经网络学习能力强、收敛速度快、具有自适应性和容错性等优点,提出小波神经网络平均影响值的发动机自变量筛选方法。根据参数之间的关系特点,建立多参数连... 为了快速准确地实现发动机参数非线性自变量筛选,基于平均影响值的思想和小波神经网络学习能力强、收敛速度快、具有自适应性和容错性等优点,提出小波神经网络平均影响值的发动机自变量筛选方法。根据参数之间的关系特点,建立多参数连续小波逼近网络模型,并给出学习算法。仿真实例表明,该方法不但能够实现复杂的非线性变量筛选,而且对比其他非线性变量筛选方法,具有精度更高、速度更快的特点。 展开更多
关键词 航空发动机 小波网络 平均影响值 变量筛选
下载PDF
离散小波变换-遗传算法-交互检验法用于近红外光谱数据的高倍压缩与变量筛选 被引量:18
16
作者 王国庆 邵学广 《分析化学》 SCIE EI CAS CSCD 北大核心 2005年第2期191-194,共4页
用遗传算法(GA)与交互检验(CV)相结合建立了一种用于对近红外光谱(NIR)数据及其离散小波 变换(DWT)系数进行变量筛选的方法,并应用于烟草样品中总挥发碱和总氮的同时测定。结果表明:NIR数 据经DWT压缩为原始大小的3.3%时基本没有光... 用遗传算法(GA)与交互检验(CV)相结合建立了一种用于对近红外光谱(NIR)数据及其离散小波 变换(DWT)系数进行变量筛选的方法,并应用于烟草样品中总挥发碱和总氮的同时测定。结果表明:NIR数 据经DWT压缩为原始大小的3.3%时基本没有光谱信息的丢失;有效的变量筛选可以极大地减少模型中的 变量个数,降低模型的复杂程度,改善预测的准确度。 展开更多
关键词 交互 离散小波变换 数据 DWT 压缩 遗传算法(GA) 时基 变量筛选 近红外光谱 挥发碱
下载PDF
基于互信息的辅助变量筛选及在火电厂NO_x软测量模型中的应用 被引量:13
17
作者 马平 李珍 梁薇 《科学技术与工程》 北大核心 2017年第22期249-254,共6页
辅助变量的选取是软测量建模中重要的一步;但由于待选变量数目多、与主导变量非线性相关、信息冗余大等因素导致辅助变量的选择不够合理。在信息熵和互信息理论基础上,改进IBF和MIFS变量筛选算法,综合考虑了辅助变量和主导变量之间的最... 辅助变量的选取是软测量建模中重要的一步;但由于待选变量数目多、与主导变量非线性相关、信息冗余大等因素导致辅助变量的选择不够合理。在信息熵和互信息理论基础上,改进IBF和MIFS变量筛选算法,综合考虑了辅助变量和主导变量之间的最大相关性,以及辅助变量之间的最小冗余性。作为算例使用改进后的算法,筛选了某燃煤机组运行历史数据,建立了省煤器出口NOx浓度的GA-BP软测量模型。实验证明这种基于互信息的变量筛选方法可以有效提高模型的输出精度和泛化能力。 展开更多
关键词 变量筛选 互信息 辅助变量 软测量
下载PDF
基于PLS的水体重金属LIBS特征变量筛选方法研究 被引量:3
18
作者 胡丽 赵南京 +2 位作者 李大创 唐磊 方丽 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2017年第8期2585-2589,共5页
在水体重金属激光诱导等离子体光谱定量分析中,一般提取光谱的多个特征变量进行浓度反演,但变量之间所包含的光谱信息可能存在重叠,回归模型的复杂程度也随之增大。为提取有效特征变量,研究了基于偏最小二乘法(PLS)的变量筛选方法。该... 在水体重金属激光诱导等离子体光谱定量分析中,一般提取光谱的多个特征变量进行浓度反演,但变量之间所包含的光谱信息可能存在重叠,回归模型的复杂程度也随之增大。为提取有效特征变量,研究了基于偏最小二乘法(PLS)的变量筛选方法。该方法以待测元素浓度为因变量,多个与待测元素浓度相关的LIBS光谱特征值为自变量,进行PLS建模;依据各原始变量的投影重要性指标值进行变量筛选,提取最优变量子集。结果表明湖库水体中Pb元素的最优变量子集为PbⅠ405.78nm峰值及峰值前相邻点光谱值、内标校正值和信背比值,训练集的复相关系数R2m=0.912。以优化变量组合进行PLS回归分析,测试集预测结果的RSD和RE分别为10.2%和7.9%,显著优于内标法的预测结果。结果还表明,变量筛选结果对于不同元素和不同水样具有一定适用性。研究结果为水体重金属LIBS定量分析提供了优质特征数据,研究方法为其他涉及变量筛选的定量分析提供了参考。 展开更多
关键词 光谱学 激光诱导击穿光谱 变量筛选 PLS方法
下载PDF
HD-SIS超高维数据稳健变量筛选 被引量:6
19
作者 张景肖 李向杰 郭海明 《统计与信息论坛》 CSSCI 北大核心 2016年第4期9-12,共4页
超高维变量筛选是统计研究的重要问题。提出一种新的变量筛选方法 HD-SIS,该方法不需要模型假设,并且对异常值有很强的抵抗能力,具有很好的稳健性。在Monte Carlo模拟中,对5种方法进行了比较,即确保独立筛选法、确保独立秩筛选法、稳健... 超高维变量筛选是统计研究的重要问题。提出一种新的变量筛选方法 HD-SIS,该方法不需要模型假设,并且对异常值有很强的抵抗能力,具有很好的稳健性。在Monte Carlo模拟中,对5种方法进行了比较,即确保独立筛选法、确保独立秩筛选法、稳健秩相关系数筛选法、距离确保独立筛选法和鞅差相关系数确保独立筛选法。模拟结果显示HD-SIS有更优良的表现。 展开更多
关键词 超高维数据 稳健性 模型释放 变量筛选
下载PDF
基于因果关系图进行多因素回归分析的变量筛选 被引量:6
20
作者 郑卫军 王晓燕 王憓 《中国卫生统计》 CSCD 北大核心 2014年第5期908-910,共3页
在流行病学研究中,常见的是采用建立线性或者logistic回归的方法分析两种或者多种现象之间的因果关系。观察性的研究中,研究者期望分析某种健康/疾病产生的多种原因,因此在构建线性或者分类回归(如logistic)模型上,往往采用同时纳入... 在流行病学研究中,常见的是采用建立线性或者logistic回归的方法分析两种或者多种现象之间的因果关系。观察性的研究中,研究者期望分析某种健康/疾病产生的多种原因,因此在构建线性或者分类回归(如logistic)模型上,往往采用同时纳入多种变量的方式模拟真实场景来分析这种健康/疾病现象产生的可能原因;临床试验中,虽然研究者主要关注干预或者实验措施的有效性,但是多因素回归模型往往也是最受欢迎的统计学方法。 展开更多
关键词 因果关系 多因素回归分析 变量筛选 LOGISTIC回归 疾病产生 回归模型 统计学方法 流行病学
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部