关键词:
肝细粒棘球蚴病
病灶活性
机器学习模型
影像组学
临床特征
摘要:
目的开发影像组学和临床特征的机器学习模型,以精准鉴别肝细粒棘球蚴病(HCE)病灶的生物活性。方法收集2018—2022年就诊于青海大学附属医院肝胆胰外科的521例HCE患者和就诊于果洛州人民医院普外科和玉树州人民医院普外科的236例HCE患者的CT图像及临床资料,提取影像特征并进行筛选。对临床资料采用单因素及多因素Logistic回归分析,筛选构建模型的特征。采用Logistic回归(LR)、支持向量机(SVM)、K-近邻算法(KNN)、随机森林(RandomForest)、极限梯度提升(XGBoost)、轻量级梯度提升机(LightGBM)、极端随机树(ExtraTrees)等7种机器学习算法构建影像组学模型和临床模型,结合影像组学模型和临床模型的预测结果,基于软投票法构建联合模型,采用Delong检验比较影像组学模型、临床模型和临床-影像联合模型的性能,并通过外部验证评估模型性能。结果共430例患者被纳入进行模型开发训练,171例患者作为外部验证,筛选出51个影像特征及5个临床特征用于构建模型。7种机器学习模型中,以XGBoost算法性能表现最佳,其构建的临床模型在训练集和外部验证集上的AUC值均最大,分别为0.977[95%置信区间(95%CI):0.964~0.990]和0.839(95%CI:0.776~0.901);其构建的影像组学模型AUC值均最大,分别为0.998(95%CI:0.997~1.000)和0.874(95%CI:0.822~0.927);其构建的联合模型AUC值均最大,分别为1.000(95%CI:0.999~1.000)和0.931(95%CI:0.894~0.968)。DeLong检验结果表明,联合模型在训练集上的性能优于临床模型(Z=2.154,P<0.05),与影像组学模型差异无统计学意义(Z=0.562,P>0.05);在外部验证集上的性能优于临床模型和影像组学模型(Z=3.338、3.331,P<0.05)。校准曲线和决策分析(DCA)曲线表明,联合模型在训练集和外部验证集的校准性能最佳、净收益最高,在不同数据集上性能稳定,在外部验证中展现了良好的泛化能力和可靠性。结论基于影像组学以及临床数据开发的机器学习模型能够精准鉴别肝细粒棘球蚴病病灶的生物活性,联合模型具更高的诊断精度和临床应用潜力,可为HCE患者的治疗方案提供参考。