关键词:
骨质疏松性骨折
机器学习
列线图
预测模型
摘要:
目的运用3种机器学习方法探讨骨质疏松症患者发生骨质疏松性骨折的危险因素,并构建列线图预测模型。方法选取2021年10月至2023年5月苏州大学附属第二医院289例骨质疏松症患者作为研究对象,按是否骨折分为骨折组(93例)和非骨折组(196例)。采用R语言开展相关研究。运用拉索回归(least absolute shrinkage and selection operator,LASSO)、极端梯度提升(extreme gradient boosting,XGBoost)、随机森林(random forest,RF)3种机器学习方法平行评估“变量”与骨质疏松性骨折风险的相关性,分析3种机器学习方法“重叠覆盖”的风险因素,采用多因素Logisitic回归方法验证结果的独立预测性。基于机器学习和多因素Logisitic回归分析筛选出的独立危险因素构建“列线图预测模型”,采用Bootstrap方法进行内部和外部验证,通过受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)、Hosmer-Lemeshow拟合优度检验、校准曲线及决策曲线(decision curve analysis,DCA)评估列线图预测模型的准确性和临床适用性。结果3种机器学习方法各自筛选到不同风险因素,经过“重叠覆盖”分析得到6项共同的骨质疏松性骨折重要风险因素:年龄、甘油三酯、Ca、血清25羟维生素D、股骨颈T值、血清白蛋白。多因素Logistic回归分析显示其中5个因素是脆性骨折的独立危险因素:年龄(OR=1.075,95%CI:1.017~1.136,P=0.011)、甘油三酯(OR=0.207,95%CI:0.103~0.415,P<0.001)、Ca(OR=0.010,95%CI:0.000~0.602,P=0.028)、股骨颈T值(OR=0.443,95%CI:0.245~0.800,P=0.007)、血清25羟维生素D(OR=0.902,95%CI:0.830~0.980,P=0.015)。基于5个预测危险因素构建的列线图预测模型验证结果显示:模型训练集AUC值为0.934(95%CI:0.897~0.972),内部验证集的AUC值为0.893(95%CI:0.802~0.984),外部验证集的AUC值为0.849(95%CI:0.792~0.905),预测效能良好。校准曲线显示预测值与理想曲线有较好一致性。Hosmer-Lemeshow拟合优度检验(训练集:χ^(2)=9.842,P=0.276;内部验证集:χ^(2)=5.174,P=0.739;外部验证集:χ^(2)=12.828,P=0.118)表明模型有较高的预测准确性。DCA表示该模型临床效能表现良好。结论3种机器学习方法共同指出的骨质疏松性骨折高风险因素有6项,经多因素Logistic回归分析认为高龄、低甘油三酯、低Ca、低血清25羟维生素D、低股骨颈T值为独立危险因素,其中低甘油三酯、低血清25羟维生素D危险因素以往报道较少。基于3种机器学习方法构建的列线图预测模型有较好便捷性、准确性,可帮助临床医生识别骨质疏松性骨折高危患者,有益实施早期干预。