关键词:
脊髓损伤
人工智能
磁共振成像
神经功能分级
摘要:
目的构建基于人工智能(AI)的创伤性颈髓损伤(TCSCI)患者急性期神经功能损伤严重程度自动分级模型,并评估其效能。方法采用回顾性队列研究分析2019年1月至2023年12月海军军医大学第二附属医院收治的315例TCSCI患者的临床资料,其中男243例,女72例;年龄30~75岁[(57.6±7.0)岁]。损伤节段:C_(1)~C_(4)143例,C_(5)~C_(8)172例。美国脊髓损伤协会(ASIA)分级:A级15例,B级53例,C级74例,D级173例。将患者按8∶2的比例随机分为训练组(252例)和测试组(63例)。根据伤后48 h内ASIA评分,评估患者感觉和运动功能;利用颈椎MRI实例分割模型提取矢状位T2加权图像中TCSCI患者严重程度损伤特征。构建的分级模型由二级级联网络构成,第一层包括梯度提升、高斯朴素贝叶斯、K近邻、决策树、随机森林和支持向量机分类器。在训练组中,分别对6个机器学习模型进行训练。第二层比较6个模型的性能,得出对应的最优分级模型,从而为每个特征匹配分级性能最佳的模型。在测试组中,通过计算准确率、召回率、精确率、平均精度和F1分数来评估各个机器学习模型的性能。结果共纳入138个临床和影像学特征用于构建TCSCI患者急性期神经功能损伤严重程度自动分级模型,其中临床神经功能特征132个(包括56个轻触觉评分、56个针刺觉评分、20个关键肌评分)和MRI影像学特征6个。在测试组中,TCSCI患者急性期神经功能损伤严重程度自动分级模型中第一层梯度提升、高斯朴素贝叶斯、K近邻、决策树、随机森林和支持向量机分类器等6个机器学习模型在轻触觉、针刺觉、关键肌运动功能整体分级中的准确率、召回率、精确率、平均精度和F1分数均在0.86以上。轻触觉功能整体分级性能中,准确率、召回率、精确率、平均精度、F1分数取得最高值的模型分别是K近邻(0.90)、梯度提升(0.99)、高斯朴素贝叶斯(0.98)、随机森林(0.96)、梯度提升(0.96)。针刺觉功能整体分级性能中,准确率、召回率、精确率、平均精度、F1分数取得最高值的模型分别是梯度提升(0.98)、高斯朴素贝叶斯(0.98)、梯度提升(0.99)、决策树(0.99)、梯度提升(0.95)。关键肌运动功能整体分级性能中,准确率、召回率、精确率、平均精度、F1分数取得最高值的模型分别是K近邻(0.97)、梯度提升和支持向量机分类器(0.97)、决策树(0.95)、随机森林(0.95)、支持向量机分类器(0.96)。在感觉功能方面,梯度提升在轻触觉与针刺觉功能整体分级中性能优胜数最多;在运动功能方面,支持向量机分类器在关键肌运动功能整体分级中性能优胜数最多。结论基于机器学习模型和二级级联网络构建的TCSCI患者急性期神经功能损伤严重程度自动分级模型,能在第二层实现第一层中各模型对每个特征分级性能结果的优选,对患者感觉和运动功能损伤严重程度具有较强的分级能力。