目的探讨头颈部肿瘤放疗患者吸入性肺炎的危险因素,通过机器学习建立预测模型并筛选最优模型。方法选取2016年5月~2023年3月福建省肿瘤医院诊治的1012例头颈部肿瘤放疗患者作为研究对象,按照3:1的比例随机分成训练集和验证集。使用最小...目的探讨头颈部肿瘤放疗患者吸入性肺炎的危险因素,通过机器学习建立预测模型并筛选最优模型。方法选取2016年5月~2023年3月福建省肿瘤医院诊治的1012例头颈部肿瘤放疗患者作为研究对象,按照3:1的比例随机分成训练集和验证集。使用最小绝对收缩和选择算子算法(The least absolute shrinkage and selection operator,LASSO)筛选危险因素。建立Logistic回归、贝叶斯网络、随机森林、支持向量机、极端梯度提升5个机器学习预测模型,并评估模型的预测效能。结果训练集中吸入性肺炎发生率为19.0%(144/759),LASSO算法筛选的4个非零系数变量分别为年龄、饮酒、肿瘤类型、吞咽困难。在训练集和验证集中,随机森林的AUC分别为0.830(95%CI:0.788~0.872)和0.870(95%CI:0.792~0.948),F1值分别为0.575和0.633,均高于其他4种预测模型。结论吸入性肺炎是头颈部肿瘤放疗患者常见并发症。在机器学习建立的5种模型中,随机森林模型的预测效果最好,为临床医护人员识别高危患者并采取积极有效的预防措施提供依据。展开更多
文摘目的探讨头颈部肿瘤放疗患者吸入性肺炎的危险因素,通过机器学习建立预测模型并筛选最优模型。方法选取2016年5月~2023年3月福建省肿瘤医院诊治的1012例头颈部肿瘤放疗患者作为研究对象,按照3:1的比例随机分成训练集和验证集。使用最小绝对收缩和选择算子算法(The least absolute shrinkage and selection operator,LASSO)筛选危险因素。建立Logistic回归、贝叶斯网络、随机森林、支持向量机、极端梯度提升5个机器学习预测模型,并评估模型的预测效能。结果训练集中吸入性肺炎发生率为19.0%(144/759),LASSO算法筛选的4个非零系数变量分别为年龄、饮酒、肿瘤类型、吞咽困难。在训练集和验证集中,随机森林的AUC分别为0.830(95%CI:0.788~0.872)和0.870(95%CI:0.792~0.948),F1值分别为0.575和0.633,均高于其他4种预测模型。结论吸入性肺炎是头颈部肿瘤放疗患者常见并发症。在机器学习建立的5种模型中,随机森林模型的预测效果最好,为临床医护人员识别高危患者并采取积极有效的预防措施提供依据。