目的:探讨结直肠息肉的影响因素并构建早期风险预测模型。方法:收集2016年11月至2021年10月于郑州大学第一附属医院健康管理中心同时进行结肠镜检查和血常规、生化指标检查的4997名受检者资料,包括22项指标,使用最小绝对收缩选择算子(LA...目的:探讨结直肠息肉的影响因素并构建早期风险预测模型。方法:收集2016年11月至2021年10月于郑州大学第一附属医院健康管理中心同时进行结肠镜检查和血常规、生化指标检查的4997名受检者资料,包括22项指标,使用最小绝对收缩选择算子(LASSO)进行特征变量筛选。按7∶3随机分组,在训练集中采用得到的最优变量构建梯度提升(Catboost)、支持向量机(SVM)、Logistic回归(LR)预测模型,在测试集中进行验证。采用χ2检验比较3种模型的准确率,进一步通过净重新分类指数(NRI)、综合判别改善指数(IDI)、ROC曲线下面积(AUC)评估模型的预测性能,并对纳入因素进行重要性评估。结果:LASSO回归得到性别、年龄、腰围(WC)、尿素(BU)、总蛋白(TP)、肾小球滤过率(GFR)、甘油三酯葡萄糖指数(TyG)等7项特征变量,基于该7项特征变量构建的SVM、Catboost模型的准确率优于LR模型(P<0.05)。SVM、Catboost、LR模型测试集的AUC(95%CI)分别为0.760(0.736~0.784)、0.766(0.742~0.790)和0.676(0.649~0.703)。进一步评估显示SVM模型预测效果最优,Catboost次之,LR最差(SVM vs Catboost/LR:NRI>0,IDI>0,P<0.05;Catboost vs LR:NRI>0,IDI>0,P<0.001)。特征重要性评估显示年龄的重要性最大,其次是WC。结论:基于性别、年龄、WC、BU、TP、GFR、TyG构建的SVM模型具备较好的预测价值。该预测模型的建立可对健康体检人群进行危险分层,有助于尽早发现结直肠癌早期病变。展开更多
文摘目的:探讨结直肠息肉的影响因素并构建早期风险预测模型。方法:收集2016年11月至2021年10月于郑州大学第一附属医院健康管理中心同时进行结肠镜检查和血常规、生化指标检查的4997名受检者资料,包括22项指标,使用最小绝对收缩选择算子(LASSO)进行特征变量筛选。按7∶3随机分组,在训练集中采用得到的最优变量构建梯度提升(Catboost)、支持向量机(SVM)、Logistic回归(LR)预测模型,在测试集中进行验证。采用χ2检验比较3种模型的准确率,进一步通过净重新分类指数(NRI)、综合判别改善指数(IDI)、ROC曲线下面积(AUC)评估模型的预测性能,并对纳入因素进行重要性评估。结果:LASSO回归得到性别、年龄、腰围(WC)、尿素(BU)、总蛋白(TP)、肾小球滤过率(GFR)、甘油三酯葡萄糖指数(TyG)等7项特征变量,基于该7项特征变量构建的SVM、Catboost模型的准确率优于LR模型(P<0.05)。SVM、Catboost、LR模型测试集的AUC(95%CI)分别为0.760(0.736~0.784)、0.766(0.742~0.790)和0.676(0.649~0.703)。进一步评估显示SVM模型预测效果最优,Catboost次之,LR最差(SVM vs Catboost/LR:NRI>0,IDI>0,P<0.05;Catboost vs LR:NRI>0,IDI>0,P<0.001)。特征重要性评估显示年龄的重要性最大,其次是WC。结论:基于性别、年龄、WC、BU、TP、GFR、TyG构建的SVM模型具备较好的预测价值。该预测模型的建立可对健康体检人群进行危险分层,有助于尽早发现结直肠癌早期病变。