期刊文献+
共找到7,774篇文章
< 1 2 250 >
每页显示 20 50 100
基于随机森林的多源小样本数据快速集成方法
1
作者 何昀 张川 +1 位作者 张继夫 陈伟 《信息与电脑》 2024年第1期52-54,共3页
受多源小样本数据属性复杂性的影响,对其进行集成处理时,过拟合和欠拟合情况较为明显。为此,文章提出基于随机森林的多源小样本数据快速集成方法。考虑多源小样本数据自身的属性特征,在构建随机森林模型阶段,充分利用粒向量与多源小样... 受多源小样本数据属性复杂性的影响,对其进行集成处理时,过拟合和欠拟合情况较为明显。为此,文章提出基于随机森林的多源小样本数据快速集成方法。考虑多源小样本数据自身的属性特征,在构建随机森林模型阶段,充分利用粒向量与多源小样本数据特征的贴合性,将其作为随机森林的基础结构,利用粒化层归一化多源小样本数据,并将输出的粒化结果作为决策层的节点。在集成阶段,根据多源小样本数据与决策层节点之间的距离,集成数据。在测试结果中,数据集成的过拟合情况占比仅为0.29%,欠拟合情况占比也仅为0.27%,具有良好的集成效果。 展开更多
关键词 随机森林 多源小样本数据 快速集成 属性特征 随机森林模型
下载PDF
基于特征变量扩展的含气饱和度随机森林预测方法 被引量:2
2
作者 桂金咏 李胜军 +2 位作者 高建虎 刘炳杨 郭欣 《岩性油气藏》 CAS CSCD 北大核心 2024年第2期65-75,共11页
采用数据驱动的方式,提出了一种基于随机森林机器学习算法训练出含气饱和度地震预测方法,并将该方法应用于中国西部复杂天然气藏中,分别对单井资料和二维地震资料进行了含气饱和度预测与分析。研究结果表明:(1)抽取井旁道纵波速度、横... 采用数据驱动的方式,提出了一种基于随机森林机器学习算法训练出含气饱和度地震预测方法,并将该方法应用于中国西部复杂天然气藏中,分别对单井资料和二维地震资料进行了含气饱和度预测与分析。研究结果表明:(1)抽取井旁道纵波速度、横波速度和密度3个弹性参数叠前地震反演结果作为基本特征变量样本,引入边界合成少数类过采样技术对基本特征变量样本和对应的含气饱和度样本进行平衡化处理;利用扩展弹性阻抗结合数学变换自动生成一系列的扩展变量;再利用随机森林对特征变量进行含气饱和度预测重要性排名,并优选重要性较高的特征变量进行含气饱和度随机森林训练。(2)该方法大幅减少了特征变量提取和优选的人工工作量,且有效减少了信息冗余以及因含气饱和度样本不平衡导致的训练偏倚问题,有效增强了随机森林算法在含气饱和度地震预测方面的能力。(3)实际单井应用中预测的含气饱和度与测井解释的含气饱和度的相关系数可达0.9855;在二维地震资料应用中,该方法比基于常规未平衡化的11个弹性参数作为随机森林输入预测出的含气饱和度精度更高。 展开更多
关键词 含气饱和度 随机森林 纵波速度 横波速度 密度 特征变量 不平衡数据 机器学习 气层预测 地震预测
下载PDF
基于随机森林和XGBoost算法构建心脏骤停患者自主循环恢复后神经功能预后不良的风险预测模型 被引量:1
3
作者 桑珍珍 崔杰 +2 位作者 闫寒 王维峰 庞秀艳 《中国急救医学》 CAS CSCD 2024年第7期577-585,共9页
目的 利用机器学习算法构建预测心脏骤停(CA)患者自主循环恢复(ROSC)后神经功能预后不良的预测模型,探索结局相关因子。方法 回顾性收集2016年1月至2024年1月沧州市中心医院收治的CA行心肺复苏(CPR)后ROSC的患者481例为研究对象。收集... 目的 利用机器学习算法构建预测心脏骤停(CA)患者自主循环恢复(ROSC)后神经功能预后不良的预测模型,探索结局相关因子。方法 回顾性收集2016年1月至2024年1月沧州市中心医院收治的CA行心肺复苏(CPR)后ROSC的患者481例为研究对象。收集患者临床资料,根据患者转出重症监护病房(ICU)时的格拉斯哥-匹兹堡脑功能表现分级(CPC)评分,将其分为预后良好组(GNO,n=158)和预后不良组(PNO,n=323)。481例患者按7∶3随机分为训练集(n=338)和测试集(n=143),训练集用于构建模型,测试集用评价模型效能。利用极端梯度提升(XGBoost)和随机森林(RF)两种机器学习算法构建患者神经功能预后不良的预测模型,分别得出影响患者神经功能预后的变量,应用SHAP进行XGBoost模型可解释性分析。将XGBoost和RF算法得出的变量取交集,再将交集变量进行多因素Logistic回归分析,得到差异有统计学意义的变量,进而构建决策树模型。在训练集和测试集上利用受试者工作特征(ROC)曲线和曲线下面积(AUC)评估决策树模型的预测性能。结果 通过XGBoost模型得到与神经功能预后不良相关的变量15个,RF模型得到与神经功能预后不良相关的变量14个,两种模型取交集得到11个与神经功能预后不良相关的交集变量[视神经鞘直径(ONSD)变化率、神经元特异性烯醇化酶(NSE)、入ICU第3天ONSD(ONSD day3)、心脏骤停至心肺复苏(CA-CPR)时间、ROSC时间、急性生理学与慢性健康状况评价Ⅱ(APACHEⅡ)评分、血肌酐、白蛋白、住ICU时间、血乳酸及年龄]。将这11个交集变量进行多因素Logistic回归分析,结果显示,PNO组与GNO组ONSD变化率、NSE、ONSD day3、ROSC时间及年龄这5个变量差异有统计学意义(P<0.05)。用这5个重要变量构建决策树模型,得出3个与患者神经功能预后不良最相关的变量(NSE、ROSC时间及ONSD变化率),在训练集上的决策树模型预测CA行CPR后ROSC患者神经功能预后不良的AUC为0.857(95%CI 0.809~0.903,P<0.001),在测试集上的AUC为0.834 (95%CI 0.761~0.906,P<0.001)。结论 基于XGBoost和RF这2种机器学习方法构建的决策树模型能够更准确地评估CA患者ROSC后神经功能的不良预后,且评价指标可能简化为NSE、ROSC时间及ONSD变化率。 展开更多
关键词 心脏骤停 自主循环恢复 神经功能 预测模型 随机森林 极端梯度提升
下载PDF
基于随机森林的发电机定子线棒局部放电图谱特征识别方法 被引量:1
4
作者 胡建林 张翕 +3 位作者 宋展 向紫馨 邓鸿飞 蒋兴良 《高电压技术》 EI CAS CSCD 北大核心 2024年第3期1272-1280,共9页
发电机定子线棒局部放电的在线监测和故障诊断对于电机故障预警、故障定位和指导机组检修有重要意义。目前存在部分不同类型局部放电相似度高,模式识别方法计算时间过长的问题,需要高精度和高效的识别方法,为此提出一种基于随机森林的... 发电机定子线棒局部放电的在线监测和故障诊断对于电机故障预警、故障定位和指导机组检修有重要意义。目前存在部分不同类型局部放电相似度高,模式识别方法计算时间过长的问题,需要高精度和高效的识别方法,为此提出一种基于随机森林的定子线棒局部放电识别方法。制备了6种类型定子线棒,用特高频天线检测局部放电信号,基于相位分布局部放电(PRPD)图谱比对,提出参数幅值不对称度。基于随机森林方法识别缺陷类型,计算特征重要性,选择有效特征。最后,可视化特征相似度,与传统反向传播(BP)神经网络方法对比,验证有效性。结果表明:随机森林算法可以有效识别人工缺陷定子线棒局部放电,总体识别正确率达到93.33%。筛选半数特征后,随机森林比BP神经网络的准确率提高了10.83%,特征选择对随机森林的准确率影响很小,但识别效率大幅提高。随机森林在少量特征时识别准确率、计算时间都明显优于神经网络。幅值不对称度参数的重要性排在全部特征前1/3,具有推广价值。 展开更多
关键词 定子线棒 局部放电 在线监测 随机森林 PRPD图谱
原文传递
基于多源数据与随机森林方法的城市建成区提取——以郑州市为例 被引量:2
5
作者 杨杰 林敬娜 程钢 《测绘工程》 2024年第2期8-17,共10页
基于夜间灯光数据的阈值分割法在城镇建成区提取研究中被广泛应用,但由于夜间灯光数据分辨率低、灯光溢出和阈值分割法无法顾及区域差异等问题,一定程度上影响了该方法的提取精度。以郑州市为例,以LJ1-01与NPP/VIIRS两种夜间灯光影像为... 基于夜间灯光数据的阈值分割法在城镇建成区提取研究中被广泛应用,但由于夜间灯光数据分辨率低、灯光溢出和阈值分割法无法顾及区域差异等问题,一定程度上影响了该方法的提取精度。以郑州市为例,以LJ1-01与NPP/VIIRS两种夜间灯光影像为主要数据源,结合Landsat8中分辨率遥感影像、网络城市兴趣点(POI)及路网数据,利用随机森林分类方法对郑州市2018年建成区进行提取,参考土地利用数据,对RF分类法与NTL、VANUI、BANUI、PANUI、RANUI指数等阈值法进行对比实验和精度评价,评估基于多源数据的随机森林分类方法在城市建成区提取中的优势。实验表明,RF比阈值法提取的建成区更接近真实建成区且提取精度更高,具有更好适用性;LJ1-01数据提取的效果和精度总体优于NPP/VIIRS数据;在采用RF分类时,各类特征的重要性在不同夜光数据源中表现差异较大。 展开更多
关键词 建成区提取 多源数据 随机森林 阈值
下载PDF
基于地理加权随机森林的黑龙江省森林碳储量遥感估测
6
作者 卫格冉 李明泽 +3 位作者 全迎 王斌 刘建阳 明烺 《中南林业科技大学学报》 CAS CSCD 北大核心 2024年第7期64-76,共13页
【目的】构建地理加权随机森林(Geographically weighted random forest,GWRF)模型估算森林碳储量以解决区域尺度范围内森林碳储量估算精度不高的问题,对科学经营管理森林、推动碳循环和碳汇相关研究、实现我国“双碳”目标有重要指导... 【目的】构建地理加权随机森林(Geographically weighted random forest,GWRF)模型估算森林碳储量以解决区域尺度范围内森林碳储量估算精度不高的问题,对科学经营管理森林、推动碳循环和碳汇相关研究、实现我国“双碳”目标有重要指导意义。【方法】以黑龙江省小兴安岭、长白山地区森林植被碳储量为研究对象,基于2015年森林资源连续清查数据和Landsat8-OLI影像,采用普通最小二乘(Ordinary least squares,OLS)、随机森林(Random forest,RF)模型、地理加权回归(Geographically weighted regression,GWR)模型以及地理加权随机森林模型分别构建不同林型及总体(不分林型)的森林碳储量估测模型,比较是否区分林分类型时,不同模型预测精度之间的差异,实现对研究区森林碳储量的精准反演。【结果】1)各个模型在区分林型时的预测精度均高于总体(不分林型)情况,以GWRF模型精度最优,其中针叶林精度最高(R^(2)=0.58,RMSE=15.97 t/hm^(2));阔叶林次之(R^(2)=0.46,RMSE=17.66 t/hm^(2));针阔混交林随后(R^(2)=0.45,RMSE=19.51 t/hm^(2));总体(不分林型)最低(R^(2)=0.40,RMSE=20.22 t/hm^(2))。2)4种模型的检验精度GWRF>RF>GWR>OLS。与OLS相比,GWRF在针叶林、阔叶林、针阔混交林和总体(不分林型)中提升的ΔR^(2)分别为0.15、0.09、0.16和0.04;降低的ΔRMSE分别为2.09、1.35、3.47和0.89 t/hm^(2);与RF相比,GWRF提升的ΔR^(2)分别为针叶林0.14、阔叶林0.06、针阔混交林0.04、总体(不分林型)0.02;降低的ΔRMSE分别为针叶林1.95 t/hm^(2)、阔叶林0.86 t/hm^(2)、针阔混交林0.67 t/hm^(2)、总体(不分林型)0.29 t/hm^(2)。3)研究区森林碳储量密度最高预测值为77.08 t/hm^(2),最低值为5.24 t/hm^(2),平均值为41.07 t/hm^(2),总量为552.04 Tg;从空间上看,森林碳储量高值分布在小兴安岭东南部、张广财岭等地区,呈现斑状不均匀性分布。【结论】相比于其他3种模型,GWRF作为局部模型,考虑到空间异质性,在区域尺度范围内估测森林碳储量有较好的应用前景。区分林分类型能提高预测精度,在今后对森林生物量或碳储量的研究中,应考虑区分林分类型建模。本研究的模型和方法有一定适应性,可为森林资源的快速和精准监测提供方法借鉴。 展开更多
关键词 森林碳储量 地理加权随机森林 地理加权回归 随机森林 遥感估测
下载PDF
基于随机森林算法的异常发热复合绝缘子分类模型 被引量:1
7
作者 胡琴 刘黎 +1 位作者 徐兴 李特 《电网技术》 EI CSCD 北大核心 2024年第1期416-424,共9页
不同类型异常发热复合绝缘子对应的检修决策、应急处理手段各不相同,因此迫切需要建立复合绝缘子异常发热类型识别方法。该文分析了表面积污、护套老化受潮和芯棒酥朽发热复合绝缘子的表面中轴线温度曲线,并定义了7个温度特征量对复合... 不同类型异常发热复合绝缘子对应的检修决策、应急处理手段各不相同,因此迫切需要建立复合绝缘子异常发热类型识别方法。该文分析了表面积污、护套老化受潮和芯棒酥朽发热复合绝缘子的表面中轴线温度曲线,并定义了7个温度特征量对复合绝缘子异常发热状态进行表征。此外,该文提出了基于随机森林算法的异常发热复合绝缘子分类型模型,并使用现场和实验室拍摄的异常发热复合绝缘子红外图像构建温度特征量样本集。采用SMOTE算法对芯棒酥朽复合绝缘子温度特征量进行数据增广、10折交叉验证选择决策树个数。模型测试结果显示,表面积污、护套老化受潮和芯棒酥朽复合绝缘子的分类精确率均在85%以上。 展开更多
关键词 异常发热 复合绝缘子 随机森林 芯棒酥朽
原文传递
基于随机森林算法的天津市滨海地区地面沉降模拟
8
作者 耿芳 白苏娜 +6 位作者 齐文艳 于金山 毛华 张梅 席雪萍 高学飞 罗福贵 《地质科技通报》 CAS CSCD 北大核心 2024年第5期197-205,共9页
地面沉降的监测与预测,对于保障城市安全和社会可持续发展具有重要意义和现实价值。利用随机森林机器学习模型预测了天津市滨海地区的地面沉降量空间分布,并评估了模型的性能和变量的重要性。基于2020年天津市滨海新区局部地区的地面沉... 地面沉降的监测与预测,对于保障城市安全和社会可持续发展具有重要意义和现实价值。利用随机森林机器学习模型预测了天津市滨海地区的地面沉降量空间分布,并评估了模型的性能和变量的重要性。基于2020年天津市滨海新区局部地区的地面沉降量、含水层岩性、含水组水位差、水文地质参数等数据来训练和验证随机森林模型。结果表明:随机森林模型能够较好地拟合和预测地面沉降量(R^(2)=0.98,RMSE=0.52 mm);影响地面沉降量最重要的因素是水位差,其次是含水层的岩性(砂-黏比值),最后是相关水文地质参数。上述结果与传统上太沙基原理基本吻合,进一步验证了模型的正确性和可预测性。本研究采用了空间分布数据来训练随机森林模型;根据物理机制,选取了重要控制因素来开展分析;评估了控制因素的重要性程度,并指出了研究的局限性和未来的研究方向,为利用随机森林模型快速有效预测地面沉降提供了重要参考和启示。 展开更多
关键词 地面沉降 滨海地区 随机森林 机器学习 天津市
下载PDF
基于随机森林和长短期记忆网络模型的高压气井环空带压预测方法
9
作者 张智 王翔辉 +1 位作者 黄媚 冯少波 《天然气工业》 EI CAS CSCD 北大核心 2024年第9期167-178,共12页
高压气井在生产过程中持续的环空带压容易引起套管柱变形或挤毁,是高压气井完整性失效的主要原因之一。为解决传统方法环空带压预测精度不高的问题,以鄂尔多斯盆地苏里格气田某高压气井为例,首先利用主成分分析法和相关系数法找到影响... 高压气井在生产过程中持续的环空带压容易引起套管柱变形或挤毁,是高压气井完整性失效的主要原因之一。为解决传统方法环空带压预测精度不高的问题,以鄂尔多斯盆地苏里格气田某高压气井为例,首先利用主成分分析法和相关系数法找到影响环空带压的主要因素,然后使用高压气井井筒温压场理论值和孤立森林模型对主成分进行物理解释和数据清洗,再对清洗后的数据使用随机森林(RF)和长短期记忆网络(LSTM)模型建立了环空带压定量预测模型,并对两类模型进行权重组合,最终建立了精确度高于任意单一模型的RF—LSTM组合环空带压预测新模型。研究结果表明:(1)环空带压的主要影响因子有温度分量、压力分量、产量分量、腐蚀程度、生产状态,而温度分量与环空带压间存在最高关联性;(2)通过错误格式、离群点及基于井筒温压场的数据清洗,可以得到数据清洗后的环空带压影响因素训练集;(3)通过平均绝对误差法(MAE)能够建立误差分数小于任意单一模型,而拟合优度介于两者之间的组合模型,因此可以将具有高拟合优度和低误差分数的两类模型结合,从而组合出同时满足两种分数的组合模型。结论认为:(1)运用大数据挖掘技术及算法进行环空带压定量预测,方法新颖,预测精度高,结果可行;(2)该方法为现场环空带压预测和风险管控提供了决策工具参考,为实现环空带压风险实时预测、预警和管控提供了理论支撑。 展开更多
关键词 环空带压 数据挖掘 随机森林 主成分分析 LSTM 大数据 预测方法
下载PDF
基于随机森林算法的重型颅脑损伤患者并发急性胃肠损伤的现状及风险模型构建
10
作者 杨晓文 许彬 +2 位作者 吴娟 王希 赵琳 《军事护理》 CSCD 北大核心 2024年第3期70-73,78,共5页
目的探讨重型颅脑损伤患者并发急性胃肠损伤的危险因素,为预防急性胃肠损伤提供借鉴。方法2021年1月至2023年1月,便利抽样法选取某院收治的重型颅脑损伤患者150例为研究对象,建立基于重型颅脑损伤并发急性胃肠损伤的危险因素的随机森林... 目的探讨重型颅脑损伤患者并发急性胃肠损伤的危险因素,为预防急性胃肠损伤提供借鉴。方法2021年1月至2023年1月,便利抽样法选取某院收治的重型颅脑损伤患者150例为研究对象,建立基于重型颅脑损伤并发急性胃肠损伤的危险因素的随机森林算法的预测模型。结果150例重症颅脑损伤患者中,并发急性胃肠损伤患者94例,占62.67%。是否并发急性胃肠道损伤的患者在糖尿病、白蛋白、APACHE-Ⅱ评分、休克指数、液体负平衡、酸中毒、深度镇静、呼吸衰竭方面的差异均有统计学意义(均P<0.05)。构建重型颅脑损伤并发急性胃肠损伤的随机森林模型,树的数量为103时出现的错误率最低;影响重型颅脑损伤并发急性胃肠损伤的因素重要性排序为糖尿病、液体负平衡、急性生理与慢性健康评分、白蛋白、深度镇静及酸中毒;随机森林模型预测重型颅脑损伤并发急性胃肠损伤的受试者工作特征曲线(receiver operating characteristic,ROC)下面积(area under curve,AUC)为0.798,Logistic回归模型的AUC为0.773。结论构建的重型颅脑损伤并发急性胃肠损伤的风险预测模型预测效能较高,临床值得推广应用。 展开更多
关键词 随机森林算法 重型颅脑损伤 急性胃肠损伤 风险模型
下载PDF
基于随机森林优化算法的城市群洪涝灾害韧性时空演变研究
11
作者 孟晓静 刘超 +2 位作者 曹莹雪 田占 陈磊 《防灾减灾工程学报》 CSCD 北大核心 2024年第4期784-791,共8页
为了提升城市应对灾害的能力,对城市洪涝灾害韧性进行研究。基于“驱动力-状态-响应(DSR)”模型建立城市洪涝灾害韧性评估指标体系,采用随机森林优化算法(RF)构建城市洪涝灾害韧性评估模型,通过均方根误差(RMSE)和决定系数(R2)评价模型... 为了提升城市应对灾害的能力,对城市洪涝灾害韧性进行研究。基于“驱动力-状态-响应(DSR)”模型建立城市洪涝灾害韧性评估指标体系,采用随机森林优化算法(RF)构建城市洪涝灾害韧性评估模型,通过均方根误差(RMSE)和决定系数(R2)评价模型性能。以关中平原城市群为例,分析西安、宝鸡、咸阳、商洛、铜川、渭南、临汾、运城、平凉、天水、庆阳等11座城市2011~2020年的城市洪涝灾害韧性时空演变规律。结果表明:驱动力和状态对城市洪涝灾害韧性水平影响较大,响应对城市洪涝灾害韧性水平影响较小;在时间序列上,关中平原城市群各城市洪涝灾害韧性水平发展存在较大差异,但整体处于平稳上升的状态,其中铜川的城市洪涝灾害韧性水平提升最为明显;在空间格局上,城市群洪涝灾害韧性水平呈现出由核心城市向外围递减的空间结构特征,各城市的洪涝灾害韧性等级的空间分布存在不均衡的现象。研究结果可为关中平原城市群韧性城市建设提供指导。 展开更多
关键词 城市洪涝灾害韧性 时空演变 DSR模型 随机森林算法
原文传递
基于随机森林的川崎病诊断关键实验室指标预测研究
12
作者 王爱琼 萨日娜 +2 位作者 张巧丽 柴利娜 李爱月 《检验医学与临床》 CAS 2024年第19期2887-2891,2897,共6页
目的通过随机森林算法构建诊断模型,分析不完全川崎病区别于完全川崎病的关键实验室指标,以提高不完全川崎病的诊断率及降低其误诊率。方法选取2018年1月至2023年6月就诊于鄂尔多斯市中心医院儿科确诊为完全川崎病或不完全川崎病的患儿... 目的通过随机森林算法构建诊断模型,分析不完全川崎病区别于完全川崎病的关键实验室指标,以提高不完全川崎病的诊断率及降低其误诊率。方法选取2018年1月至2023年6月就诊于鄂尔多斯市中心医院儿科确诊为完全川崎病或不完全川崎病的患儿145例,其中不完全川崎病34例(不完全组),完全川崎病111例(完全组)。比较两组红细胞计数、血红蛋白、红细胞沉降率、血钠、白细胞计数、血小板计数、平均血小板体积、中性粒细胞计数、中性粒细胞百分比、淋巴细胞计数、淋巴细胞百分比、C反应蛋白、丙氨酸转氨酶、总蛋白、清蛋白、总胆红素、天冬氨酸转氨酶、降钙素原(PCT)、肌酸激酶、肌酸激酶M多肽(CK-M)、N末端B型钠尿肽前体(NT-proBNP)、凝血酶原时间、凝血酶时间、D-二聚体、尿白细胞计数的差异,利用随机森林算法构建诊断模型,分析不完全川崎病区别于完全川崎病的实验室指标。结果模型结果显示,贡献度前5位的实验室指标依次为血小板计数(0.381)、尿白细胞计数(0.372)、淋巴细胞百分比(0.260)、凝血酶时间(0.255)及中性粒细胞百分比(0.163),在区分川崎病类型方面具有重要的指示意义。构建的诊断模型ROC曲线下面积为0.864,灵敏度为1.00,特异度为0.74。结论通过随机森林算法得出,血小板计数、尿白细胞计数、淋巴细胞百分比、凝血酶时间以及中性粒细胞百分比可作为诊断不完全川崎病的关键实验室指标,这为患儿的诊断与及时治疗提供理论依据。 展开更多
关键词 随机森林 不完全川崎病 实验室指标 早期诊断 完全川崎病
下载PDF
基于随机森林法的铣刀磨损状态监测
13
作者 张丹 隋文涛 +1 位作者 李志永 陈锦 《机械设计与制造》 北大核心 2024年第9期12-15,共4页
针对机床加工过程中铣削刀具状态监测困难,以及单传感器监测法存在信息不全的问题,提出了一种利用随机森林完成多传感器信息融合的刀具磨损状态监测研究方法。在不同的切削参数下,以声发射传感器和振动传感器为信号采集元件,多方位采集... 针对机床加工过程中铣削刀具状态监测困难,以及单传感器监测法存在信息不全的问题,提出了一种利用随机森林完成多传感器信息融合的刀具磨损状态监测研究方法。在不同的切削参数下,以声发射传感器和振动传感器为信号采集元件,多方位采集信号,并对信号进行时域、频域、小波包分析,提取其对刀具状态敏感的共计23个特征量,构建随机森林模型对铣刀状态进行监测。实验结果表明,该研究方法识别刀具准确率达90.0%,具有可行性。 展开更多
关键词 声发射 振动信号 刀具磨损状态 特征提取 随机森林
下载PDF
基于随机森林算法建立非急诊大手术后延迟拔管的预测模型
14
作者 李鹏 朱静文 +3 位作者 许开伟 张玉 傅海峰 杜文文 《临床麻醉学杂志》 CAS CSCD 北大核心 2024年第1期7-12,共6页
目的基于随机森林算法分析非急诊大手术后延迟拔管的影响因素,建立并验证术后延迟拔管的预测模型。方法回顾性收集2018年1月至2022年12月全麻下行非急诊大手术的7528例患者的临床资料。根据术后2 h内是否拔管,将患者分为两组:非延迟拔管... 目的基于随机森林算法分析非急诊大手术后延迟拔管的影响因素,建立并验证术后延迟拔管的预测模型。方法回顾性收集2018年1月至2022年12月全麻下行非急诊大手术的7528例患者的临床资料。根据术后2 h内是否拔管,将患者分为两组:非延迟拔管组(≤2 h)和延迟拔管组(>2 h)。将患者按照7∶3分为训练集和验证集,通过LASSO回归、Logistic回归筛选术后延迟拔管的预测因素,采用随机森林算法建立并验证预测模型。结果有123例(1.6%)出现术后延迟拔管。ASA分级、科室、术中使用氟比洛芬酯、右美托咪定、激素、术中出现低钙血症、重度贫血、术中输血、气道痉挛是术后延迟拔管的独立预测因素。基于随机森林算法建立的预测模型在验证集中的曲线下面积(AUC)为0.751(95%CI 0.742~0.778),敏感性98.1%,特异性41.9%。结论基于随机森林算法建立的非急诊大手术后拔管延迟的预测模型具有较好的预测性能,利用该模型有助于预防非急诊大手术后延迟拔管。 展开更多
关键词 随机森林 大手术 延迟拔管 危险因素 预测模型
下载PDF
基于双随机森林的发热待查智能诊断方法
15
作者 杜建超 丁俊瑶 +5 位作者 赵梦楠 连建奇 陈天艳 WU Yuan 周云 石磊 《生物医学工程学进展》 CAS 2024年第3期197-205,共9页
在机器学习预测模型中,不平衡数据集会降低少数类的预测准确性。针对发热待查数据集的不平衡特性,该文提出了一种基于K-Means聚类欠采样的双随机森林病因预测方法。首先通过K-Means聚类欠采样构建一个平衡数据集,并在此基础上创建一个基... 在机器学习预测模型中,不平衡数据集会降低少数类的预测准确性。针对发热待查数据集的不平衡特性,该文提出了一种基于K-Means聚类欠采样的双随机森林病因预测方法。首先通过K-Means聚类欠采样构建一个平衡数据集,并在此基础上创建一个基于CART投票机制的随机森林预测模型。然后对初始数据集用同样的方法创建一个随机森林预测模型。最后将两个随机森林预测模型联合,使用两者的CART一起投票预测。该文提出的方法增加了CART的数量,在保持原有数据集特性的同时,提高了少数类的投票权重。在发热待查数据集上的实验表明,该文所提方法不仅改善了少数类的预测性能,对其他类别的预测性能也有一定程度的提升。 展开更多
关键词 智能诊断 机器学习 发热待查 随机森林 不平衡数据集
下载PDF
一种随机森林增强的车载容迟网络路由算法
16
作者 吴家皋 芮琦 刘林峰 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1188-1195,共8页
针对车载容迟网络(Vehicular Delay Tolerant Network,VDTN)中车辆节点高速移动造成的通信链路不稳定性问题,利用车辆节点的移动模式,提出了一种随机森林增强的VDTN路由算法.首先,引入与车辆节点运动相联系的属性并利用动态相遇奖励机... 针对车载容迟网络(Vehicular Delay Tolerant Network,VDTN)中车辆节点高速移动造成的通信链路不稳定性问题,利用车辆节点的移动模式,提出了一种随机森林增强的VDTN路由算法.首先,引入与车辆节点运动相联系的属性并利用动态相遇奖励机制对车辆节点进行分类,以此构建初始随机森林模型.接着,从决策树的分类性能和多样性两个方面优化模型,选择分类性能好、多样性高的决策树构造改进的随机森林模型,其中,决策树的分类性能和多样性分别根据每棵树分类错误率及相应的惩罚权重和由不合度量定义的决策树之间的相似度来衡量.最后,根据改进的随机森林模型提出新的VDTN路由算法.仿真实验证明,所提出的路由算法能显著提高消息的投递率,降低消息的投递时延,从而验证了其有效性. 展开更多
关键词 车载容迟网络 随机森林 路由算法 分类性能 多样性
下载PDF
一种基于随机森林分类器构建高性能应用程序性能分析模型的方法
17
作者 柴旭清 乔一航 范黎林 《计算机工程与科学》 CSCD 北大核心 2024年第7期1218-1228,共11页
高性能应用程序的传统性能分析方法因分析过程存在额外开销和分析结果不准确等缺陷,致使用户耗费更多的时间和领域知识。为解决以上问题,将程序的性能分析问题转化成高维特征下非平衡小样本数据集的多分类问题,采集500条包含程序运行时... 高性能应用程序的传统性能分析方法因分析过程存在额外开销和分析结果不准确等缺陷,致使用户耗费更多的时间和领域知识。为解决以上问题,将程序的性能分析问题转化成高维特征下非平衡小样本数据集的多分类问题,采集500条包含程序运行时进程切换次数、内存利用率、磁盘I/O负载等7种性能数据,经PCA降维等数据预处理后,使用随机森林分类器训练程序性能问题分析模型。实验验证该模型可识别出内存利用率过高、磁盘I/O负载过重等5类性能问题。为评估模型的指导有效性,分别采集HotSpot3D程序和LU-Decomposition程序运行时产生的性能数据,并根据模型输出结果指导,分别基于运行级和编译级优化2个验证程序运行。实验结果表明,所提方法可有效指导优化程序的运行性能,2个验证程序的加速比分别为1.056和5.657。 展开更多
关键词 Nmon 性能分析 变分自编码器 聚类 随机森林
下载PDF
非瓣膜性心房颤动患者左心房血栓或自发显影的随机森林模型构建及抗凝结局
18
作者 郑楠 刘冰 +3 位作者 闫洪伟 李凤鹏 于恺 张军 《岭南心血管病杂志》 CAS 2024年第1期22-27,56,共7页
目的 构建非瓣膜性心房颤动(non-valvular atrial fibrillation,NVAF)患者左心房血栓(left atrial thrombus,LAT)或自发显影(spontaneous echo contrast,SEC)的随机森林模型,并分析LAT/SEC患者抗凝治疗的临床结局。方法 回顾性分析2016... 目的 构建非瓣膜性心房颤动(non-valvular atrial fibrillation,NVAF)患者左心房血栓(left atrial thrombus,LAT)或自发显影(spontaneous echo contrast,SEC)的随机森林模型,并分析LAT/SEC患者抗凝治疗的临床结局。方法 回顾性分析2016年1月至2021年11月河北省沧州市中心医院接受经食管超声心动图检查的NVAF患者的临床资料。构建随机森林模型,通过受试者工作特征曲线(receiver operating characteristic curve,ROC)评价随机森林模型预测LAT/SEC的曲线下面积(area under the curve,AUC),并与CHADS2和CHA2DS2-VASc评分进行对比。结果 386例NVAF患者中,38例(9.8%)发生LAT/SEC。影响LAT/SEC发生的7个最重要的变量是左心室舒张末期内径、估算肾小球滤过率、左心室射血分数、非阵发性心房颤动、左心房内径、未抗凝治疗和脑卒中史。随机森林模型的AUC为0.93(95%CI:0.88~0.99),CHADS2评分的AUC为0.73(95%CI:0.63~0.83),CHA2DS2-VASc评分的AUC为0.72(95%CI:0.62~0.83),随机森林模型的AUC高于CHADS2(Z=3.42,P<0.001)和CHA2DS2-VASc(Z=3.05,P<0.001)评分。随机森林模型预测LAT/SEC的敏感度为92.6%,特异度为89.8%。38例LAT/SEC患者中,55.3%(21/38)患者经抗凝治疗后复查经食管超声心电图,66.7%(14/21)患者LAT/SEC溶解。17例直接口服抗凝剂治疗的患者中,4例LAT和8例SEC溶解;4例华法林治疗的患者中,1例LAT和1例SEC溶解。结论 随机森林模型可用于预测NVAF患者LAT/SEC,其诊断效能优于CHADS2及CHA2DS2-VASc评分。三分之二的LAT/SEC患者抗凝治疗后LAT/SEC溶解。 展开更多
关键词 心房颤动 左心房血栓 自发显影 随机森林
下载PDF
基于随机森林算法和逻辑回归预测妊娠剧吐的危险因素
19
作者 高媛媛 王灿 +2 位作者 王晶 寇印巧 王璐鹏 《河北医药》 CAS 2024年第4期616-619,共4页
目的开发新的预测模型,识别妊娠剧吐危险因素,以有效预测妊娠剧吐发病。方法选取2020至2022年118例孕妇作为研究对象,分为妊娠剧吐组和非妊娠剧吐组,每组59例。构建一个随机森林模型和传统的多因素逻辑回归模型。然后分别分析2个模型的... 目的开发新的预测模型,识别妊娠剧吐危险因素,以有效预测妊娠剧吐发病。方法选取2020至2022年118例孕妇作为研究对象,分为妊娠剧吐组和非妊娠剧吐组,每组59例。构建一个随机森林模型和传统的多因素逻辑回归模型。然后分别分析2个模型的分析结果。结果随机森林分析结果显示在以基尼系数平均下降为基准,影响因素排序为:低BMI(BMI<20 kg/m^(2)),妊娠剧吐家族史,孕妇年龄,胎儿性别,葡萄胎病史等。多因素逻辑回归模型对数据集的分析结果确定了包括低BMI、妊娠剧吐家族历史、女性胎儿、吸烟史、多胎妊娠、精神病史、糖尿病、上消化道病史、甲状腺机能亢进史和葡萄胎病史均与妊娠剧吐发生显著相关。结论本研究建立了基于随机森林的发生风险预测模型,具有较好的预测价值,为预防诊断妊娠剧吐提供科学依据和快速筛查工具。 展开更多
关键词 妊娠剧吐 危险因素 随机森林 恶心 呕吐
下载PDF
基于随机森林模型分析共情心理对大学生心理健康的影响
20
作者 夏学仓 高小惠 +1 位作者 房少洁 刘超 《中国健康教育》 北大核心 2024年第4期321-325,共5页
目的运用随机森林算法分析共情心理对大学生心理健康的影响。方法采取方便抽样的方法,以问卷调查的方式于2022年8月对河北省某大学的1383名学生进行在线调查,内容包括调查对象一般情况以及基本共情量表和症状自评量表。使用最小二乘法... 目的运用随机森林算法分析共情心理对大学生心理健康的影响。方法采取方便抽样的方法,以问卷调查的方式于2022年8月对河北省某大学的1383名学生进行在线调查,内容包括调查对象一般情况以及基本共情量表和症状自评量表。使用最小二乘法回归模型分析共情心理是否为大学生心理健康的影响因素,构建随机森林模型分析共情心理对大学生心理健康的重要性。结果共回收问卷1383份,有效问卷1348份,问卷有效率为97.5%。回归模型结果表明,共情心理对大学生心理健康水平的影响具有统计学意义(t=-2.051,P<0.05)。随机森林模型的结果显示,大学生心理健康重要性排名前3位的解释变量分别为共情心理、睡眠质量以及学业压力。结论共情心理是影响大学生心理健康的重要因素。建议合理开展提升共情心理能力的活动,关心学生的睡眠时长,适当减轻学生的学业压力。 展开更多
关键词 心理健康水平 共情心理 随机森林模型 大学生
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部