在维普、万方、知网、Embase、PubMed和Web of Science数据库中检索2019~2023年间有关机器学习方法预测抑郁症发病风险的文献,系统性地总结这些算法的特点、研究领域、模型效能和当前应用所面临的问题和挑战。研究共纳入92篇文献,结果显...在维普、万方、知网、Embase、PubMed和Web of Science数据库中检索2019~2023年间有关机器学习方法预测抑郁症发病风险的文献,系统性地总结这些算法的特点、研究领域、模型效能和当前应用所面临的问题和挑战。研究共纳入92篇文献,结果显示,机器学习预测抑郁症发病风险的模型效果较好,最佳预测模型的AUC值为0.6030~0.9976。未来应当建立多中心、前瞻性的融合多模态的动态预测模型,为抑郁症的临床诊断提供更可靠的依据。展开更多
文摘目的:全球冠心病(coronary artery heart disease,CHD)发病率居高不下,给公共卫生系统带来了极大的负担和挑战。有效预防和早期诊断CHD成为减轻这一负担的关键策略。本研究致力于探索运用先进的机器学习技术来提高CHD早期筛查和风险评估的准确性。方法:纳入美国国家卫生和营养调查(National Health and Nutrition Examination Survey,NHANES)数据库1999至2018年49490名研究对象,将数据集按7꞉3划分为训练集和测试集。以研究对象是否被告知患有CHD为因变量(输出变量),并以此为依据分为CHD组和非CHD组。通过查阅CHD相关危险因素的文献,最终纳入68个自变量。分析研究对象的变量特征,并比较其在CHD组与非CHD组之间差异。采用机器学习算法随机森林(randomForest_4.7-1.1)和XGBoost(xgboost_1.7.7.1)进行变量选择。综合分析这2种算法识别出的重要性排名前10的变量,选取这2个算法共同认定的变量。使用广义线性模型来分析变量与CHD之间的关系,采用经典的逻辑回归构建CHD风险预测模型。使用受试者操作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)评估模型在区分CHD和非CHD个体方面的能力;采用Hosmer-Lemeshow拟合优度检验进行校准测量,评估预测值与实际CHD比例之间的一致性;应用决策曲线评估模型风险预测的临床益处;采用诺谟图直观展示最终模型风险评分。结果:总人群的年龄为(49.53±18.31)岁,男性占51.8%。与非CHD组相比,CHD组患者的年龄较大[(69.05±11.32)岁vs(48.67±18.07)岁,P<0.001],女性比例更高(67.1%vs 47.4%,P<0.001),且在体重指数、收缩压、舒张压和吸烟等经典心血管危险因素上的差异均有统计学意义(均P<0.001)。此外,CHD组与非CHD组在能量摄入量、维生素E、维生素K、钙、磷、镁、锌、铜、钠、钾、硒等非经典心血管影响因素上的差异也均有统计学意义(均P<0.05)。最终确定了6个与CHD发生最相关的关键变量。并构建CHD风险预测模型如下:logit(p)=−7.783+0.074×年龄+0.003×肌酐−0.003×血小板+0.257×糖化血糖蛋白+0.003×尿酸+0.101×红细胞体积分布宽度变异系数。模型在预测CHD方面表现出优异的判别能力,其准确度为0.712,AUC值为0.841。校准曲线显示在训练集和测试集中,预测概率与实际值之间有良好的一致性,表明模型稳定、可靠。决策曲线表明该模型在不同阈值概率范围内提供了净效益,支持其在临床决策中的应用潜力。结论:本研究利用机器学习技术识别可能的CHD风险因素,并成功开发了一个简洁且实用的临床预测模型。未来需要进一步前瞻性临床队列研究验证其在临床应用中的潜力,使其能够在实际医疗环境中提供有效的心血管疾病预防和干预策略。
文摘在维普、万方、知网、Embase、PubMed和Web of Science数据库中检索2019~2023年间有关机器学习方法预测抑郁症发病风险的文献,系统性地总结这些算法的特点、研究领域、模型效能和当前应用所面临的问题和挑战。研究共纳入92篇文献,结果显示,机器学习预测抑郁症发病风险的模型效果较好,最佳预测模型的AUC值为0.6030~0.9976。未来应当建立多中心、前瞻性的融合多模态的动态预测模型,为抑郁症的临床诊断提供更可靠的依据。