关键词:
糖尿病周围神经病变
预测模型
2型糖尿病
机器学习
支持向量机模型
影响因素
摘要:
目的 通过使用机器学习算法在早期识别2型糖尿病并发的糖尿病周围神经病变(Diabetic Peripheral Neuropathy, DPN),并探索DPN与各项检查指标之间的关系,为预防DPN提供依据。方法 选择2022—2023年上海同济医院确诊的糖尿病患者720例,根据纳排标准,纳入665例患者作为研究对象,其中并发DPN患者340例(DPN组),未并发DPN患者325例(非DPN组)。比较2组患者的临床资料、实验室检查指标及肌电图指标,探讨2型糖尿病患者并发DPN的影响因素。并通过超参数调优机器学习算法,建立2型糖尿病患者并发DPN的预测模型,采用准确度、精度、召回率、F1评分和受试者工作特征曲线下面积(AUC)验证模型的可靠性和临床实用性,采用Shapley加法解释(SHapley Additive exPlanations, SHAP)技术对最优模型输出进行解释。结果 通过筛选特征,构建了随机森林(RF)、Stacking模型、XGBoost、支持向量机等四种机器学习分类算法对DPN进行预测,并且所有分类器的AUC值都超过了可接受的70%阈值。通过分析模型性能显示,支持向量分类器的准确率最佳,为74.84%,其次分别为XGBoost、Stacking模型、RF,并且支持向量分类器在F1 Score和精确率中也表现最佳,分别为0.7665和80.0%;然而,分析ROC曲线显示,XGBoost的曲线下面积(AUC)最高为0.757,其次分别为RF、支持向量机、Stacking模型;Stacking模型在召回率中表现最佳,为88.1%,其次分别为XGBoost、RF、支持向量机。模型变量重要性以及支持向量机的SHAP结果表明,年龄、病程、肾功能指标(PRO、UACR、MALB、24hMALB、UCr)、Ddimer、空腹C肽、维生素D、心血管病变(下肢动脉和颈动脉斑块的长度和厚度乘积、下肢动脉斑块长度)、血小板计数、低密度脂蛋白胆固醇、空腹胰岛素、直接胆红素是DPN的重要预测因素。结论 本研究构建了4种类型的DPN风险预测模型并选出支持向量机模型作为最优模型,通过在机器学习框架内利用患者的临床资料和实验室指标进行糖尿病神经病变诊断,利用预测模型提前筛查患者的得病情况,辅助医生进行初期诊断,提升诊疗效率;利用模型进一步确定与DPN相关的影响因素,通过有效控制和监测这些变量,预防或延缓糖尿病患者周围神经病变的进展可能是可行的。基于各种指标比较了这些模型的预测效果,本研究显示了ML作为DPN强大预测工具的潜力。