关键词:
急性缺血性卒中
阿替普酶
溶栓
脑出血
预测模型
机器学习
摘要:
目的基于机器学习算法对急性缺血性卒中(acute ischemic stroke,AIS)或TIA患者行rt-PA静脉溶栓治疗住院期间脑出血的发生情况进行预测,并探索影响rt-PA溶栓治疗后脑出血发生的危险因素。方法纳入中国卒中中心联盟(Chinese Stroke Center Alliance,CSCA)2016年1月—2020年12月登记的被初步诊断为AIS或TIA且接受rt-PA静脉溶栓治疗的患者74654例,平均年龄为(65.55±12.14)岁,其中,男性患者48493例(64.96%),住院期间发生脑出血患者2038例(2.73%)。将数据按年份划分为训练集和测试集,即2016—2019年登记患者划分为训练集,2020年登记患者划分为测试集,采用原型选择下采样技术对训练集数据正负样本进行77∶100平衡处理,构建了逻辑回归、极致梯度提升(extreme gradient boosting,XGBoost)、随机森林、梯度提升决策树(gradient boosting decision tree,GBDT)和分类梯度提升(categorical boosting,CatBoost)共5个模型对脑出血结局进行预测,并使用AUC、灵敏度、特异度、Brier评分等指标对模型预测效果进行评价和比较,采用SHAP图对机器学习模型筛选出的特征进行可解释性分析。结果XG Boost、GBDT、Cat Boost、逻辑回归和随机森林模型的A U C值分别为0.770(95%CI 0.745~0.774)、0.766(95%CI 0.753~0.786)、0.765(95%CI 0.752~0.766)、0.758(95%CI 0.747~0.761)和0.757(95%CI 0.739~0.759),灵敏度分别为0.624(95%CI 0.574~0.672)、0.606(95%CI 0.555~0.655)、0.570(95%CI 0.519~0.620)、0.557(95%CI 0.506~0.607)和0.585(95%CI 0.534~0.635),特异度分别为0.780(95%CI 0.773~0.786)、0.785(95%CI 0.778~0.791)、0.790(95%CI 0.783~0.796)、0.805(95%CI 0.799~0.811)和0.769(95%CI 0.762~0.776),Brier评分分别为0.157、0.154、0.156、0.160和0.161分。通过SHAP图解释结果发现,住院NIHSS评分高、年龄大、空腹血糖水平高、既往心房颤动病史、血小板计数低、发病距溶栓治疗时间窗长、BMI低、就诊时NIHSS评分高等特征为rt-PA溶栓治疗住院期间发生脑出血的危险因素。结论基于机器学习构建的预测模型对行rt-PA静脉溶栓治疗的AIS患者住院期间脑出血的发生具有一定预测效果,本研究对未来机器学习技术在脑出血预测领域的应用有一定探索价值。