期刊文献+
共找到1,701篇文章
< 1 2 86 >
每页显示 20 50 100
基于粒子群优化后随机森林模型的管道内腐蚀风险预测
1
作者 肖雯雯 葛鹏莉 +6 位作者 胡广强 吕瑶 龙武 刘青山 郜双武 曲志豪 张雷 《腐蚀与防护》 北大核心 2025年第2期59-65,共7页
基于塔河油田历史失效数据,使用Pearson相关性分析和灰色关联度分析确定管道内腐蚀主控因素,并将其作为模型输入变量,腐蚀速率作为输出变量,建立随机森林(RF)腐蚀预测模型。为提高预测精度,使用粒子群优化(PSO)算法对RF模型的超参数进... 基于塔河油田历史失效数据,使用Pearson相关性分析和灰色关联度分析确定管道内腐蚀主控因素,并将其作为模型输入变量,腐蚀速率作为输出变量,建立随机森林(RF)腐蚀预测模型。为提高预测精度,使用粒子群优化(PSO)算法对RF模型的超参数进行优化。结果表明:塔河油田输油管道内腐蚀主控因素为CO_(2)分压、温度、Cl^(-)含量和H_(2)S分压;经PSO优化后RF模型的决定系数R~2为0.97,均方根误差为0.161,平均绝对误差为0.027,均优于其他3种模型。因此,PSO优化后RF模型能够准确预测管道的腐蚀速率,为油气田管道的腐蚀预警和防护提供依据和支持。 展开更多
关键词 CO_(2)-H_(2)S腐蚀 机器学习 随机森林(rf) 粒子群优化(PSO) 腐蚀速率
下载PDF
随机森林和决策树模型在腹腔镜联合胆道镜术后胆总管结石复发风险预测中的效能比较
2
作者 马剑锋 黑涛 +1 位作者 赵正国 杨伟龙 《河南医学研究》 2025年第8期1415-1419,共5页
目的 探讨随机森林和决策树模型在腹腔镜联合胆道镜术后胆总管结石复发风险预测中的效能比较。方法 选取98例胆总管结石行腹腔镜联合胆道镜手术的患者,依据患者术后6个月内胆总管结石是否复发分成复发组和未复发组。对比两组基线资料的... 目的 探讨随机森林和决策树模型在腹腔镜联合胆道镜术后胆总管结石复发风险预测中的效能比较。方法 选取98例胆总管结石行腹腔镜联合胆道镜手术的患者,依据患者术后6个月内胆总管结石是否复发分成复发组和未复发组。对比两组基线资料的差异,影响因素使用logistic回归分析法;分别构建随机森林模型、决策树模型,并采用受试者工作特征(ROC)曲线分析两种模型对术后胆总管结石复发风险的预测效能。结果 logistic回归显示,伴胆道手术史、感染、胆管扩张及乳头旁憩室,且高龄、结石和胆总管直径较长、结石数量≥2枚是术后结石复发因素(P<0.05);ROC曲线分析结果显示,随机森林和决策树模型预测术后胆总管结石复发的曲线下面积(AUC)分别为0.928(95%CI:0.827~0.974)、0.853(95%CI:0.796~0.916)。经Delong检验结果显示,随机森林模型得AUC值较决策树模型高(D=3.452,P=0.012)。结论 随机森林和决策树模型均具有良好的预测效能,随机森林模型的预测效能优于决策树模型。 展开更多
关键词 胆总管结石 复发 腹腔镜 胆道镜 随机森林模型 决策树模型
下载PDF
基于随机森林模型的机械通气患者静脉血栓栓塞症的影响因素分析
3
作者 李玲 邹颖凤 +2 位作者 黄柳云 谢明杰 黄德斌 《广西医学》 2025年第1期55-60,共6页
目的探讨机械通气患者发生静脉血栓栓塞症(VTE)的现状,并基于随机森林模型分析其影响因素。方法收集263例机械通气患者的临床资料,根据VTE的发生情况,将患者分为VTE组和非VTE组,并进行单因素分析。采用随机森林模型对单因素分析中差异... 目的探讨机械通气患者发生静脉血栓栓塞症(VTE)的现状,并基于随机森林模型分析其影响因素。方法收集263例机械通气患者的临床资料,根据VTE的发生情况,将患者分为VTE组和非VTE组,并进行单因素分析。采用随机森林模型对单因素分析中差异具有统计学意义的变量进行重要性排序,使用LASSO分析筛选变量。通过多因素Logistic回归模型分析机械通气患者发生VTE的影响因素。结果263例患者中,62例患者发生VTE,发生率为23.6%。单因素分析结果显示,两组患者的年龄、住ICU时间、急性生理学与慢性健康状况评价Ⅱ评分、合并高血压情况、肌力、D-二聚体水平、使用镇静药情况、使用血管活性药情况、机械通气时长、纤维蛋白原水平比较,差异有统计学意义(P<0.05)。LASSO分析结果显示,当λ值为0.0135时,误差最小,所对应的影响因素个数为8个。将随机森林模型中重要性排名前8的变量(住ICU时间、机械通气时长、D-二聚体水平、年龄、合并高血压情况、肌力、纤维蛋白原水平、使用血管活性药情况)纳入多因素Logistic回归分析,结果显示,年龄、住ICU时间、合并高血压情况是机械通气患者发生VTE的影响因素(P<0.05)。结论机械通气患者VTE的发生率较高,其中年龄≥60岁、住ICU时间≥7d、合并高血压的机械通气患者发生VTE的风险增加。 展开更多
关键词 机械通气 静脉血栓栓塞症 随机森林模型 影响因素
下载PDF
基于高斯混合模型双向聚类重采样和随机森林构建DLBCL早期复发预测模型
4
作者 王俊霞 张岩波 +9 位作者 余红梅 曹红艳 周洁 乔宇 张高源 于凯 王雪嫚 郭玉娇 赵志强 罗艳虹 《中国卫生统计》 北大核心 2025年第1期7-11,17,共6页
目的应用一种可以同时解决少数类和多数类类间和类内不平衡问题的类别不平衡处理方法,并将其与随机森林(random forest,RF)分类器结合实现对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者早期复发的预测,为DLBLC患者的... 目的应用一种可以同时解决少数类和多数类类间和类内不平衡问题的类别不平衡处理方法,并将其与随机森林(random forest,RF)分类器结合实现对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者早期复发的预测,为DLBLC患者的治疗提供参考。方法首先使用一种基于高斯混合模型双向聚类重采样的类别不平衡处理方法(Gaussian mixture model,GMM-GMM)处理数据,并与随机过采样(random over sampling,ROS)、合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)、Borderline-1 SMOTE、Borderline-2 SMOTE、GMM上采样、GMM下采样、SMOTE+RUS、SMOTE+GMM和GMM+RUS进行比较,然后以RF作为分类器验证10种类别不平衡方法的性能,之后为验证RF的性能,在处理后的数据集上使用logistic回归和决策树(decision tree,DT)作为对照,最后从区分度和校准度两方面对模型进行评价。结果在本文所有模型中,采用GMM-GMM的RF模型取得了相对最优的分类性能(accuracy=0.79,AUC=0.87,sensitivity=0.71,specificity=0.87,G-means=0.79,MSE=0.21)。结论GMM-GMM优于其他传统的重采样方法,结合RF用于DLBCL患者早期复发的预测取得了相对较好的分类结果,可以很好地实现对DLBCL患者早期复发的预测。 展开更多
关键词 类别不平衡 高斯混合模型聚类重采样 随机森林 复发预测 弥漫大B细胞淋巴瘤
下载PDF
基于随机森林模型评估冬奥会期间太原市大气氨的气象和排放影响
5
作者 任明权 崔阳 +3 位作者 郭利利 何秋生 吉东生 王跃思 《地球与环境》 北大核心 2025年第1期64-73,共10页
为保障第24届冬季奥林匹克运动会期间(2022年2月4日至20日)的空气质量,太原市实施了一系列人为管控(机动车限行和工业企业减产)措施。为评估短期控制措施对城市大气NH_(3)的影响,本研究使用MARGA仪器于2022年1月1日至2月20日期间在太原... 为保障第24届冬季奥林匹克运动会期间(2022年2月4日至20日)的空气质量,太原市实施了一系列人为管控(机动车限行和工业企业减产)措施。为评估短期控制措施对城市大气NH_(3)的影响,本研究使用MARGA仪器于2022年1月1日至2月20日期间在太原市一城市站点对小时分辨率的气态NH_(3)及水溶性离子进行了在线观测,分析了其污染特征并采用随机森林模型评估了气象和排放的影响。研究结果表明冬奥会管控期C2(1月30日至2月20日)NH_(3)浓度(5.4±3.3μg/m^(3))低于管控前时段C1(1月1日至1月29日;8.4±3.9μg/m^(3))36.0%。与C1期间相比,C2期间更高的风速(1.8±0.8 m/s)和大气边界层高度(508.1±636.7 m)有利于污染物扩散,而C2期间酸性气体NO_(2)(47.8%)和SO_(2)浓度(33.2%)的显著降低会通过气相分配提升NH_(3)浓度,表明气象和化学因素会干扰排放变化对NH_(3)影响评估。随机森林模型分析结果显示C2期间NH_(3)、NH_(4)^(+)和TNHx(NH_(3)+NH_(4)^(+))气象归一化浓度较C1时期分别下降25.2%、21.3%和20.3%。TNHx由于综合考虑人为排放和二次转化的影响能更好地反映人为排放造成NH_(3)的真实变化。C2期间人为减排和气象因素对TNHx下降的贡献分别为39.5%和60.5%,表明在有利的气象条件影响下人为减排进一步降低了TNHx浓度。研究结果可为其他区域评估管控措施对环境空气质量的影响提供一定的科学参考。 展开更多
关键词 氨气 气粒转化 随机森林模型 冬奥会
原文传递
基于随机森林模型的中国气溶胶光学厚度反演及变化分析
6
作者 赵乐鋆 李夫星 +6 位作者 王丽梅 蒋镕致 孔韵宁 王金 吴佳仪 赵子渝 王诗瑶 《地球与环境》 北大核心 2025年第1期74-88,共15页
以地面气象站点监测数据与MAIAC AOD数据构建随机森林模型,对2018—2019年中国气溶胶光学厚度(AOD)反演,并分析时空变化。结论如下:(1)将数据集划为春、夏、秋、冬4组,分组训练模型优化参数,最终确定决策树个数分别为250、250、200、200... 以地面气象站点监测数据与MAIAC AOD数据构建随机森林模型,对2018—2019年中国气溶胶光学厚度(AOD)反演,并分析时空变化。结论如下:(1)将数据集划为春、夏、秋、冬4组,分组训练模型优化参数,最终确定决策树个数分别为250、250、200、200,决策树最大深度分别为40、90、40、40。经检验在该参数下模型的学习精度较高,参数具有较强的可靠性,决定系数(R^(2))分别为0.925、0.922、0.935、0.930,均方根误差(RMSE)分别为0.091、0.082、0.055、0.065;(2)基于确定的参数完成AOD反演后,利用AERONET AOD数据检验模型的估值精度,R^(2)为0.891,RMSE为0.129,整体精度较高。同时,各地面气象站点反演后的AOD年均值与原始AOD年均值相比变化趋势相近,且略高于原始年均值;(3)相较于2018年,2019年中国AOD值整体略低,空气质量有所改善;不同季节的AOD大小关系为:春季>夏季>冬季>秋季;(4)中国AOD值空间分布呈现出“东南高西北低”的特征,与胡焕庸线揭示的我国人口分布格局相一致。华北平原、华中地区、四川盆地等AOD偏高;南疆地区由于气候干旱,植被稀疏,沙尘天气频繁,AOD值也较高;东北地区、青藏高原、云贵高原与内蒙古高原,受地形地势、地理位置等影响,经济实力偏弱,人口分布稀疏,AOD偏低。 展开更多
关键词 随机森林模型 MAIAC AOD AERONET AOD 时空分布特征 变化趋势
原文传递
基于决策树和随机森林算法模型预测醛固酮瘤患者术后血压恢复情况
7
作者 关兆娟 薛舒婷 +2 位作者 谷婷钰 张岩波 王彦 《山西医科大学学报》 2025年第2期127-133,共7页
目的 构建决策树和随机森林算法模型,预测醛固酮瘤患者术后血压恢复情况,评估其预测效果,并识别影响术后血压恢复的关键因素。方法 收集211例醛固酮瘤患者的基本信息,按照7∶3的比例将数据集划分为训练集和测试集。在训练集上分别使用... 目的 构建决策树和随机森林算法模型,预测醛固酮瘤患者术后血压恢复情况,评估其预测效果,并识别影响术后血压恢复的关键因素。方法 收集211例醛固酮瘤患者的基本信息,按照7∶3的比例将数据集划分为训练集和测试集。在训练集上分别使用决策树和随机森林算法模型构建醛固酮瘤患者术后血压恢复情况的预测模型,并在测试集上进行验证。通过比较两种模型的预测性能,评估其在术后血压恢复预测中的效果。结果 在211例醛固酮瘤患者中,术后血压恢复正常的患者79例,术后血压有所改善但未治愈的患者132例,术后血压治愈率为37.4%。两组患者在年龄、体质量指数、高血压病程及肾小球滤过率等方面差异有统计学意义(P<0.05)。决策树模型的预测准确率为0.75,特异度为0.82,灵敏度为0.64,AUC为0.79,F1分数为0.67;随机森林模型的预测准确率为0.81,特异度为0.87,灵敏度为0.72,AUC为0.87,F1分数为0.75,故随机森林模型的预测性能优于决策树模型。结论 随机森林模型能够更准确地预测醛固酮瘤患者术后血压的恢复情况,有效识别出年龄、体质量指数、高血压病程和肾小球滤过率等影响因素。该模型可为醛固酮瘤患者术后血压的临床治疗和个性化管理提供科学依据。 展开更多
关键词 醛固酮瘤 肾上腺切除术 血压 预测模型 决策树模型 随机森林算法模型 影响因素
下载PDF
基于随机森林的多模态神经电生理指标预测老年脑卒中患者衰弱风险模型研究
8
作者 张晓雯 秦丽云 +1 位作者 陈文倩 孙毅 《国际医药卫生导报》 2025年第6期973-978,共6页
目的构建基于多模态神经电生理指标的老年脑卒中患者衰弱风险预测模型,探索其在早期干预中的应用价值。方法采用回顾性分析,选取2021年1月至2023年1月山东第一医科大学附属东平医院收治的265例老年首次急性脑卒中住院患者,男148例、女11... 目的构建基于多模态神经电生理指标的老年脑卒中患者衰弱风险预测模型,探索其在早期干预中的应用价值。方法采用回顾性分析,选取2021年1月至2023年1月山东第一医科大学附属东平医院收治的265例老年首次急性脑卒中住院患者,男148例、女117例,年龄(70.42±8.63)岁,缺血性卒中220例、出血性卒中45例,收集基线资料及神经电生理指标。采用Fried衰弱表型量表评估衰弱状态,使用独立样本t检验、秩和检验、χ^(2)检验进行单因素分析,logistic回归进行多因素分析。采用随机森林算法构建预测模型并与logistic回归模型进行比较。结果265例患者分为训练组212例,验证组53例,两组一般特征、临床指标、实验室检查和神经电生理指标等基线资料比较,差异均无统计学意义(均P>0.05)。衰弱组98例、非衰弱组167例,两组患者年龄、美国国立卫生研究院卒中量表(NIHSS)评分、白蛋白、神经电生理指标及功能、认知评分等比较,差异均有统计学意义(均P<0.05)。多因素分析显示,基线NIHSS评分(OR=1.17)、蒙特利尔认知评估量表(MoCA)评分(OR=0.87)、年龄(OR=1.09)、经颅磁刺激(TMS)皮质静息期(OR=1.11)、白蛋白(OR=0.89)、定量脑电图(qEEG)δ波功率(OR=1.05)和老年抑郁评估量表(GDS-15)评分(OR=1.18)是脑卒中后衰弱的独立预测因子(均P<0.05)。随机森林模型受试者操作特征曲线(ROC)的曲线下面积(AUC=0.728)高于多因素logistic回归模型(AUC=0.629),P=0.029。结论整合多模态神经电生理指标和临床特征可显著提高老年脑卒中后衰弱的预测精度。 展开更多
关键词 脑卒中 老年 衰弱 神经电生理 预测模型 随机森林 Logistics回归
下载PDF
基于随机森林模型的中青年乳腺癌患者未成年子女养育忧虑及其影响因素
9
作者 宋宜芬 孙香莲 +5 位作者 刘晨 张金蕾 尹晓晓 张雅晴 贾维慧 尹崇高 《现代临床护理》 2025年第2期1-9,共9页
目的基于随机森林模型探讨中青年乳腺癌患者未成年子女养育忧虑现状及其影响因素,为临床干预提供依据。方法采用便利抽样法,选择2023年4月至12月在本市某三级甲等综合医院乳腺外科接受诊疗的275例乳腺癌患者为研究对象。采用自行设计的... 目的基于随机森林模型探讨中青年乳腺癌患者未成年子女养育忧虑现状及其影响因素,为临床干预提供依据。方法采用便利抽样法,选择2023年4月至12月在本市某三级甲等综合医院乳腺外科接受诊疗的275例乳腺癌患者为研究对象。采用自行设计的一般资料问卷、中文版养育忧虑问卷(parenting concerns questionnaire,PCQ)、领悟社会支持量表(perceived social support scale,PSSS)、癌症复发担忧量表(concern about recurrence scale,CARS)、简易疾病感知量表(brief illness perception questionnaire,BIPQ)进行调查。基于随机森林模型和最小绝对收缩和选择算法(least absolute shrinkage and selection operator,LASSO)对变量进行重要性排序和变量筛选,将筛选后的变量纳入多元线性回归分析。结果260例患者完成研究。中青年乳腺癌患者养育忧虑得分为(51.1±6.4)分。将随机森林及LASSO回归确定的变量,纳入多元线性回归分析结果显示(并按影响因素重次要排序),疾病感知越高、领悟社会支持越低、癌症复发担忧越大、肿瘤分期Ⅳ期、离异/丧偶、未成年子女个数越多的中青年乳腺癌患者养育的忧虑越严重(均P<0.05),解释总变异的57.0%。结论中青年乳腺癌患者养育忧虑处于中等偏高水平,受多种因素影响,医护人员应针对性制订措施给予干预,以便降低患者养育忧虑水平。 展开更多
关键词 乳腺癌 养育忧虑 社会支持 癌症复发担忧 疾病感知 随机森林模型 最小绝对收缩和选择算法回归 横断面研究
下载PDF
基于随机森林模型的地表细小死可燃物载量估算
10
作者 刘世好 胡稳 +3 位作者 杨旸谷 阳胜男 徐云 张家阳 《浙江农林大学学报》 北大核心 2025年第2期312-320,共9页
【目的】研究地表细小死可燃物载量估算方法及空间分布。【方法】基于遥感数据、野外样地调查结果,通过随机森林模型,估算湖南省安化县172个乔木林和竹林标准地的地表细小死可燃物载量,并分析各因子在估算过程中的重要性。【结果】(1)... 【目的】研究地表细小死可燃物载量估算方法及空间分布。【方法】基于遥感数据、野外样地调查结果,通过随机森林模型,估算湖南省安化县172个乔木林和竹林标准地的地表细小死可燃物载量,并分析各因子在估算过程中的重要性。【结果】(1)随机森林模型对地表细小死可燃物载量的估算精度较高,在训练集和验证集上的决定系数(R2)分别为0.930和0.724,均方根误差分别为0.2623和0.4166 t·hm^(-2),均通过了0.01水平的置信度检验。(2)估算过程中各因子的重要性存在显著差异,重要性指数排名从大到小依次为植被类型因子(39.95%)、林分因子(7.23%)、地形因子(3.91%)、光谱特征指数因子(3.82%)。(3)安化县地表细小死可燃物载量为1.18~6.19 t·hm^(-2),高可燃物载量的区域集中于江南镇、田庄乡、马路镇、烟溪镇、乐安镇、梅城镇和滔溪镇。【结论】随机森林模型可较好地应用于地表细小死可燃物载量估算,可为区域森林管理和保护,以及减少林火风险提供可靠方法。 展开更多
关键词 随机森林模型 地表细小死可燃物 可燃物载量 林分因子 Sentinel-2A 森林火灾
下载PDF
随机森林模型解析极端暴雨洪峰流量驱动要素——以北京“23·7”暴雨为例
11
作者 车海伦 李华林 +3 位作者 张帆 吴凤月 谢晨新 刘晔 《北京林业大学学报》 北大核心 2025年第1期51-62,共12页
【目的】为明晰极端暴雨下洪峰流量形成的驱动要素,对北京“23·7”极端暴雨洪峰进行调查,从而揭示洪峰流量的变化规律,为区域灾后重建规划与防灾减灾工作提供科学依据。【方法】在2023年北京“23·7”极端暴雨发生后,对位于暴... 【目的】为明晰极端暴雨下洪峰流量形成的驱动要素,对北京“23·7”极端暴雨洪峰进行调查,从而揭示洪峰流量的变化规律,为区域灾后重建规划与防灾减灾工作提供科学依据。【方法】在2023年北京“23·7”极端暴雨发生后,对位于暴雨中心的门头沟区56条沟道140个洪痕点位开展调查,在明晰沟道洪峰流量空间变化基础上,使用随机森林模型定量分析各要素对沟道洪峰流量的驱动规律。【结果】(1)门头沟区沟道洪峰流量大小分布与降雨中心分布有较强一致性,整体由北向南递增,洪峰流量范围在27.5~1072.0 m3/s之间,超过10、20、50年一遇洪峰流量水平的沟道分别占总数的82%、71%、41%。(2)本次降雨条件下,影响门头沟区沟道洪峰流量差异的前5个因素依次为流域面积、沟道长度、平均起伏度、径流系数和淤积量,其相对重要值依次为1.000、0.524、0.471、0.382、0.346,表明地形因素对此次暴雨条件下门头沟区沟道洪峰流量影响最大。(3)各要素与洪峰流量存在复杂的非线性关系。【结论】根据最重要的5个驱动因素,建议灾后恢复重建工作中,以沟道为基本单位,实施“一沟一策”管理策略。合理布设防洪措施,提高工程防洪标准,重点关注淤积量、径流系数等关键可控因素。同时完善应急预案,整治侵占沟道行洪空间等问题,以提升区域的抗洪能力。未来研究需扩展至土地使用模式、水利设施建设等人为因素,因地制宜地分析洪峰流量影响机制,为不同地区的防灾减灾工作提供精准的指导。 展开更多
关键词 北京“23·7”暴雨 洪峰流量调查 门头沟区沟道 曼宁公式 驱动要素解析 随机森林模型
下载PDF
基于随机森林回归模型的煤胶质层指数预测
12
作者 王利民 朱立江 刘金鸽 《中国科技论文》 2025年第3期267-276,共10页
为了提升煤质检测效率,构建了机器学习回归模型,旨在提升煤质分析的效率和精确度。通过分析99种不同煤样的关键工业参数(包括水分、灰分、挥发分、硫分、粘结指数和胶质层指数),该模型构建了一个全面的数据集。首先,运用皮尔逊相关性分... 为了提升煤质检测效率,构建了机器学习回归模型,旨在提升煤质分析的效率和精确度。通过分析99种不同煤样的关键工业参数(包括水分、灰分、挥发分、硫分、粘结指数和胶质层指数),该模型构建了一个全面的数据集。首先,运用皮尔逊相关性分析来识别与胶质层指数密切相关的特征,并采用递归特征消除(recursive feature elimination,RFE)与交叉验证结合的方法进一步精炼特征选择。通过构建3种机器学习模型——随机森林回归模型、支持向量机回归模型和决策树回归模型完成煤胶质层指数预测。通过网格搜索和交叉验证技术对模型的超参数进行优化,以确保模型达到最佳性能。模型的最终评估结果表明,随机森林回归模型预测精度非常高,决定系数(R²)达到了0.969,均方根误差(root mean squared error,RMSE)为0.171,平均绝对误差(mean absolute error,MAE)为0.108。 展开更多
关键词 胶质层指数 机器学习 随机森林 回归模型 交叉验证
下载PDF
基于信息量模型与随机森林模型的滑坡易发性评价——以海东市为例
13
作者 常锦春 程传美 牛鹏飞 《统计学与应用》 2025年第3期293-306,共14页
为进一步推进塔吉克斯坦地区的地质灾害评估工作,本文采用信息量模型和随机森林模型对海东市的滑坡灾害进行易发性评价,并通过ROC曲线对这两种模型的性能进行了评估。结果表明,信息量模型与随机森林模型均表现出良好的分类能力,然而随... 为进一步推进塔吉克斯坦地区的地质灾害评估工作,本文采用信息量模型和随机森林模型对海东市的滑坡灾害进行易发性评价,并通过ROC曲线对这两种模型的性能进行了评估。结果表明,信息量模型与随机森林模型均表现出良好的分类能力,然而随机森林模型的表现更优于信息量模型。信息量模型在对相关因子的分级分析中表现卓越,能够有效识别某因子分级内对滑坡影响最深的区间。而随机森林模型则在衡量因子的相对重要性方面具有优势。两种模型各具特色,结合使用能够更全面地掌握滑坡灾害的成因与易发性,为后续的地质灾害防治措施提供科学依据。To further advance the assessment of geological disasters in the Tajikistan region, this paper employs the information value model and the random forest model to evaluate the susceptibility to landslides in Haidong City, and assesses the performance of these two models using ROC curves. The results indicate that both the information value model and the random forest model demonstrate good classification capabilities;however, the random forest model outperforms the information value model. The information value model excels in the graded analysis of relevant factors, effectively identifying the intervals within a factor’s grading that have the most significant impact on landslides. In contrast, the random forest model has an advantage in measuring the relative importance of factors. Each model has its unique characteristics, and their combined use can provide a more comprehensive understanding of the causes and susceptibility of landslide disasters, offering a scientific basis for subsequent geological disaster prevention and control measures. 展开更多
关键词 地质灾害 信息量模型 随机森林 易发性评价
下载PDF
大学生人格特质对抑郁水平的影响:基于随机森林模型分析
14
作者 侯世玲 肖放 +1 位作者 牛佳伟 周燚森 《心理学进展》 2025年第3期262-269,共8页
目的:运用随机森林算法研究大学生人格特质对抑郁水平的影响。方法:采用中国大五人格问卷极简版、抑郁自评量表对1436名大学生进行测量。使用回归模型分析大学生人格特质是否影响其抑郁水平,通过R语言构建随机森林模型分析大学生人格特... 目的:运用随机森林算法研究大学生人格特质对抑郁水平的影响。方法:采用中国大五人格问卷极简版、抑郁自评量表对1436名大学生进行测量。使用回归模型分析大学生人格特质是否影响其抑郁水平,通过R语言构建随机森林模型分析大学生人格特质对抑郁水平的重要性。结果:回收到有效问卷1368份,问卷有效率为95.3%。回归模型显示,大学生人格特质对其心理健康的影响有统计学意义。随机森林模型显示,大学生人格特质对抑郁水平的影响按重要性排名分别是神经质、责任心、宜人性、开放性、外倾性。结论:人格特质是影响大学生心理健康中的抑郁水平的重要因素。测量大学生的人格特质,是识别和干预大学生抑郁水平的有效途径。Objective: The random forest algorithm was used to explore the influence of personality traits on depression level of college students. Methods: 1436 college students were measured by the Chinese Big Five Personality Questionnaire Inventory Brief 15-item Version and Self-rating Depression Scale. Regression model was used to analyze whether college students’ personality traits affected their depression level, and R language was used to construct a random forest model to analyze the importance of college students’ personality traits to depression level. Results: 1368 valid questionnaires were collected, the effective rate was 95.3%. The regression model shows that the influence of college students’ personality traits on their mental health has statistical significance. Random Forest model shows that the influence of personality traits on depression level of college students is neuroticism, conscientiousness, agreeableness, openness and extraversion. Conclusion: Personality trait is an important factor affecting the level of depression in college students’ mental health. Measuring the personality traits of college students is an effective way to identify and intervene in their levels of depression. 展开更多
关键词 心理健康 抑郁 随机森林模型 大学生
下载PDF
基于随机森林与ARIMA模型的降水变化与灾害风险评估
15
作者 崔培琪 《理论数学》 2025年第1期237-258,共22页
随着对地观测技术的飞速发展,我们能够以前所未有的精度和频率获取地球表面的各种数据,通过进行更精细的空间分析和时间序列分析,可以揭示地理环境变化的深层次规律。本文旨在建立中国降水量变化趋势及其与海拔、坡度、土地利用之间的... 随着对地观测技术的飞速发展,我们能够以前所未有的精度和频率获取地球表面的各种数据,通过进行更精细的空间分析和时间序列分析,可以揭示地理环境变化的深层次规律。本文旨在建立中国降水量变化趋势及其与海拔、坡度、土地利用之间的预测模型。通过对降水量、地形因素和五种主要土地覆盖类型的相关性分析,运用Logistic回归和随机森林模型探讨了这些因素对灾害发生的共同影响机制。此外,采用ARIMA时间序列模型预测了未来2025年到2035年间的降水量和土地利用格局,并结合随机森林模型评估了此期间各地区暴雨灾害风险的空间分布。研究结果揭示了在极端天气条件下最脆弱的地区,为灾害防范和土地规划提供了重要参考。With the rapid advancement of remote sensing technologies, we are now able to obtain various data on the Earth’s surface with unprecedented accuracy and frequency. Through more refined spatial and time series analyses, the underlying patterns of geographical environmental changes can be revealed. This study aims to establish predictive models for the trends in precipitation changes in China and their relationships with elevation, slope, and land use. By analyzing the correlations between precipitation, topographic factors, and five major land cover types, the study employs Logistic regression and Random Forest models to explore the joint impact of these factors on the occurrence of disasters. Additionally, the ARIMA time series model is utilized to forecast precipitation and land use patterns from 2025 to 2035, while the Random Forest model is applied to assess the spatial distribution of rainfall disaster risks during this period. The results of the study highlight the most vulnerable regions under extreme weather conditions, providing valuable insights for disaster prevention and land planning. 展开更多
关键词 LOGISTIC回归模型 随机森林预测模型 ARIMA时间序列模型 中国土地利用变化 暴雨成灾
下载PDF
Logistic回归与随机森林模型在新中式服装消费行为影响因素中的应用
16
作者 徐菲悦 孙嬿茹 +2 位作者 颜格 严德兴 田海蕾 《统计学与应用》 2025年第1期258-274,共17页
Dior“文化挪用”马面裙事件引发民众热议,以“马面裙”为代表的新中式服装走进大众视野。新中式服装实现了传统文化与现代时尚的完美融合,其产业发展在经济、文化等不同维度上均具有重要价值,因而了解民众对新中式服装的情感倾向与关注... Dior“文化挪用”马面裙事件引发民众热议,以“马面裙”为代表的新中式服装走进大众视野。新中式服装实现了传统文化与现代时尚的完美融合,其产业发展在经济、文化等不同维度上均具有重要价值,因而了解民众对新中式服装的情感倾向与关注点,深入分析影响民众关于新中式服装购买意愿的影响因素对新中式服装产业的未来发展及传统文化传承具有深远意义。团队通过网络爬取进行文本分析,为问卷设计提供理论支持。基于描述性统计分析构建消费者画像,综合应用二值Logistic回归与随机森林模型确定影响消费意愿的主要因素,从消费者因素、产品因素和推广途径三个方面明确新中式服装的市场方向,以此提出有价值的结论与建议。结果表明,性别、年龄、学历、收入、地区作用的消费者自身因素是影响新中式服装购买意愿的最主要因素。Dior’s “cultural appropriation” incident involving horse-face skirts has sparked public discussion, and new Chinese-style clothing represented by the horse-face skirts has entered the public eye. This style perfectly blends traditional culture with modern fashion, and its industrial development has important value in different dimensions such as economy and culture. Therefore, understanding the emotional tendencies and concerns of the public towards the new Chinese-style clothing, and conducting a deep analysis of the factors influencing the public’s willingness to purchase such clothing have profound significance for the future development of the new Chinese-style clothing industry and the inheritance of traditional culture. The team conducted text analysis through web crawling to provide theoretical support for questionnaire design. Based on descriptive statistical analysis, a consumer portrait is constructed, and binary logistic regression and random forest models are comprehensively applied to determine the main factors affecting consumers’ willingness. Clarifying the market direction of new Chinese-style clothing from three aspects: consumer factors, product attributes, and promotional channels, in order to provide valuable conclusions and suggestions. The results indicate that consumer factors such as gender, age, education, income, and regional influence are the most significant factors affecting the willingness to purchase new Chinese-style clothing. 展开更多
关键词 新中式服装 购买意愿 文本挖掘 二值Logistic回归模型 随机森林模型
下载PDF
基于确定性系数与随机森林模型的滑坡易发性评价
17
作者 王喜 徐世光 陈玉波 《江西科学》 2025年第2期375-384,共10页
为了科学准确地对滑坡进行易发性分析,以保山盆地周边地区为研究区,选取海拔、坡度、坡向、归一化植被覆盖度(NDVI)、工程地质岩组、距道路距离、距断层距离、距水系距离、灾害点密度共9个关键的灾害孕育与诱发滑坡因素作为评价指标因... 为了科学准确地对滑坡进行易发性分析,以保山盆地周边地区为研究区,选取海拔、坡度、坡向、归一化植被覆盖度(NDVI)、工程地质岩组、距道路距离、距断层距离、距水系距离、灾害点密度共9个关键的灾害孕育与诱发滑坡因素作为评价指标因子。建立确定系数法模型(CF)和确定系数法与随机森林耦合模型(CF-RF)评价盆地周边滑坡易发性。结果表明,CF模型和CF-RF模型滑坡易发性等级的频率比值从低到极高易发区明显增大,均有效评价了保山盆地周边滑坡易发性;且CF模型在引入随机森林算法进行精细化处理后,CF-RF模型在评价精度上实现了提升,AUC值提高了0.034;此外,采用均值递减精度和平均降低基尼系数2种计算方法计算、评价了各个评价因子的重要程度。结果表明,灾害点密度因子对保山盆地周边的滑坡易发性有重要的影响。研究可为保山盆地周边地区滑坡监测预警及防治提供技术参考。 展开更多
关键词 确定性系数法 随机森林模型 滑坡易发性 耦合模型 保山盆地周边
下载PDF
随机森林模型下的数字经济指数预测与八大经济区差异研究
18
作者 赵子璇 《理论数学》 2025年第1期120-129,共10页
随着数字化转型的加速,数字经济已成为推动中国经济高质量发展的重要引擎。然而,不同区域之间数字经济的发展水平存在显著差异,对区域间差距及其演变规律的研究具有重要意义。本研究基于2000年至2022年中国八大经济区的数字经济指数数据... 随着数字化转型的加速,数字经济已成为推动中国经济高质量发展的重要引擎。然而,不同区域之间数字经济的发展水平存在显著差异,对区域间差距及其演变规律的研究具有重要意义。本研究基于2000年至2022年中国八大经济区的数字经济指数数据,利用随机森林模型对全国数字经济指数进行动态预测,并分析区域间的数字经济差异及其成因。研究结果表明,未来五年(2025~2029年)全国数字经济指数将保持稳步增长。区域分析显示,东部沿海经济区的数字经济指数始终领先,大西北和黄河中游经济区则相对较低但增长势头良好。基于研究结果,本研究提出了加强中西部地区政策支持、优化数字基础设施建设、推动区域协同发展以及激发内生动力等政策建议,以促进区域间数字经济的均衡发展。本研究为理解中国数字经济发展的总体趋势与区域特征提供了重要参考,也为优化数字经济政策制定和实现高质量发展提供了科学依据。With the acceleration of digital transformation, the digital economy has become an important engine to promote the high-quality development of China’s economy. However, there are significant differences in the development level of digital economy among different regions, and it is of great significance to study the inter-regional gap and its evolution pattern. Based on the digital economy index data of China’s eight economic regions from 2000 to 2022, this study uses the Random Forest Model to dynamically forecast the national digital economy index and analyze the inter-regional digital economy differences and their causes. The results show that the national digital economy index will maintain a steady growth in the next five years (2025~2029). Regional analyses show that the Eastern Coastal Economic Zone consistently leads the Digital Economy Index, while the Great Northwest and Middle Yellow River Economic Zones have relatively low but good growth momentum. Based on the findings, this study proposes policy recommendations such as strengthening policy support in the central and western regions, optimizing digital infrastructure construction, promoting regional synergistic development, and stimulating endogenous dynamics, in order to promote balanced development of the digital economy among regions. This study provides an important reference for understanding the general trend and regional characteristics of China’s digital economy development, as well as a scientific basis for optimizing digital economy policymaking and achieving high-quality development. 展开更多
关键词 数字经济指数 随机森林模型 八大经济区 区域差异 动态预测
下载PDF
基于优化随机森林模型的藏东南地区滑坡主控因子分析及易发性评价
19
作者 卫璐宁 郭永刚 周兴波 《地质与资源》 2025年第1期112-127,共16页
以藏东南地区为研究对象,通过优化随机森林模型对滑坡易发性进行深入分析,探讨影响滑坡发生的主要因素.通过现场调查、遥感数据分析和文献综述,系统筛选了滑坡与非滑坡样本,并优化了模型的滑坡-非滑坡样本筛选方法、影响因子的选取、联... 以藏东南地区为研究对象,通过优化随机森林模型对滑坡易发性进行深入分析,探讨影响滑坡发生的主要因素.通过现场调查、遥感数据分析和文献综述,系统筛选了滑坡与非滑坡样本,并优化了模型的滑坡-非滑坡样本筛选方法、影响因子的选取、联结方法的应用以及超参数的优化.采用非支配排序算法(NSGA-Ⅱ)优化随机森林模型(多目标优化)与RF-GA模型(单目标优化)进行对比分析,最优准确率、召回率、精确率、F1四项指标较RF-GA模型分别提高了3.3%、8.7%、3.2%、1.9%.在滑坡易发性分区方面,高、较高、中易发区面积占比分别提升了2.7%、3.1%、1.2%.通过绘制ROC曲线和计算AUC值,验证了RF-NSGA-Ⅱ模型的高准确性(AUC=0.877).研究结果显示,藏东南地区的滑坡易发区主要集中在易贡藏布与帕隆藏布的交汇处以及雅鲁藏布江的大拐弯区域.在影响因子的重要性排序中,距道路距离、高程和距河流距离排名靠前,地质构造复杂、断层发育密集以及长期构造活动的影响使得这些区域滑坡发育频繁,特别是在断层纵横交错、岩石破碎和节理发育明显的高易发区域. 展开更多
关键词 滑坡灾害 优化随机森林模型 易发性评价 主控因子 藏东南
下载PDF
基于无人机影像与随机森林模型的农作物提取研究
20
作者 周利伟 刘创创 +3 位作者 唐文泰 赵男 高继超 邹威峰 《软件工程与应用》 2025年第1期1-7,共7页
本研究基于无人机影像数据和随机森林模型,探讨了农作物提取的方法与效果。通过对无人机获取的高分辨率影像进行处理和分析,结合机器学习算法,实现了对农作物种植区域的自动提取和分类。研究结果表明,结合无人机影像和随机森林模型能够... 本研究基于无人机影像数据和随机森林模型,探讨了农作物提取的方法与效果。通过对无人机获取的高分辨率影像进行处理和分析,结合机器学习算法,实现了对农作物种植区域的自动提取和分类。研究结果表明,结合无人机影像和随机森林模型能够有效地提高农作物提取的准确性和效率,为农业生产提供了重要的技术支持。Based on UAV (Unmanned Aerial Vehicle) image data and the random forest model, this study explored the methods and effects of crop extraction. By processing and analyzing the high-resolution images obtained by UAVs and combining with machine learning algorithms, the automatic extraction and classification of crop planting areas were achieved. The research results show that the combination of UAV images and the random forest model can effectively improve the accuracy and efficiency of crop extraction, providing important technical support for agricultural production. 展开更多
关键词 无人机影像 随机森林模型 农作物提取 机器学习算法
下载PDF
上一页 1 2 86 下一页 到第
使用帮助 返回顶部