关键词:
2型糖尿病
骨质疏松
预测模型
机器学习
老年
摘要:
目的 基于机器学习算法构建老年2型糖尿病患者骨质疏松风险预测模型,筛选预测效能最优模型并进行验证。方法 2023年5—12月郑州大学第一附属医院诊治老年2型糖尿病患者180例,采用双能X射线吸收法测定骨密度,根据是否患骨质疏松分为骨质疏松组83例和非骨质疏松组97例,比较性别比例、年龄、糖尿病病程、体质量指数(BMI)、尿微量白蛋白(MAlb)、糖化血红蛋白(HbA_(1)c)、总胆固醇(TC)、甲状旁腺激素(PTH)等水平。采用lasso回归筛选预测老年2型糖尿病患者并发骨质疏松的影响因素,采用7种机器学习算法(决策树、随机森林、k最邻近、朴素贝叶斯、支持向量机、极端梯度提升、多因素logistic回归)构建老年2型糖尿病患者并发骨质疏松的预测模型,并比较灵敏度、特异度、准确率、精确度、AUC,筛选出效能最优的预测模型,并绘制校准曲线和决策曲线,评估模型的临床应用价值。结果 180例患者骨质疏松发生率为46.11%。骨质疏松组年龄[(69.87±6.85)岁]大于非骨质疏松组[(66.22±6.13)岁](t=-23.588,P<0.001),糖尿病病程[(17.22±8.23)年]长于非骨质疏松组[(12.29±7.06)年](t=-4.265,P<0.001),女性比率、MAlb、HbA_(1)c及血清TC、PTH水平[59.0%、14.8(6.5, 72.3)mg/L、9.5%(8.5%, 10.8%)、(4.73±1.19)mmol/L、(39.83±18.97)ng/L]均高于非骨质疏松组[51.5%、9.5(6.1, 14.3)mg/L、7.1%(6.0%, 8.0%)、(4.18±1.19)mmol/L、(29.12±16.41)ng/L](χ^(2)=4.756,Z=2.011、-9.473,t=-3.129、-4.016,P均<0.05),BMI[(23.14±3.24)kg/m^(2)]低于非骨质疏松组[(25.43±5.37)kg/m^(2)](t=3.535,P<0.001)。lasso回归筛选老年2型糖尿病患者并发骨质疏松的影响因素为性别、年龄、糖尿病病程、BMI、MAlb、HbA_(1)c、TC、PTH。根据lasso回归筛选出的影响因素,采用7种机器学习算法构建老年2型糖尿病患者并发骨质疏松的预测模型,结果显示随机森林算法构建的预测模型效能最优,灵敏度为94.9%,特异度为97.8%,准确率为96.1%,精确度为98.0%,AUC为0.998。决策曲线分析结果显示,模型在大部分阈概率范围内净收益较高,临床实用性较强;校准曲线分析结果显示,校准曲线与理想曲线重合度较高,拟合良好。结论 基于性别、年龄、糖尿病病程、BMI、MAlb、HbA_(1)c、TC、PTH变量,采用不同机器学习算法构建的预测模型中,随机森林算法模型预测老年2型糖尿病患者并发骨质疏松的效能最高,具有较高的临床应用价值。