关键词:
胃肿瘤
脉管侵犯
机器学习
CT影像组学
摘要:
目的探讨术前增强CT影像组学融合模型对胃癌脉管侵犯(LVI)的预测价值。方法回顾性队列研究。纳入2017年1—8月于山西省肿瘤医院行根治性切除术且经病理证实为胃腺癌的患者436例,其中男354例、女82例,年龄25~85(59.9±9.3)岁,术前均行腹部增强CT检查。患者按照7∶3比例随机分为训练集305例和验证集131例。依据病理结果分为LVI阳性组222例、LVI阴性组214例。在静脉期增强CT薄层图像上对病灶逐层勾画感兴趣区,并采用Python软件提取影像组学特征。采用Pearson相关、单变量分析、单变量逻辑回归和5折交叉验证结合最小绝对收缩和选择算子进行特征筛选,对关键特征使用随机森林(RF)、极端梯度提升(XGB)、支持向量机(SVM)和逻辑回归(LR)4种机器学习方法构建影像组学模型,并筛选出其中预测效能最佳的影像组学模型。同时,用单因素和多因素logistic回归分析方法从临床病理特征中筛选胃癌LVI的独立危险因素并构建临床模型。联合胃癌LVI的独立危险因素及最佳影像组学模型构建融合模型,并绘制列线图。使用受试者操作特征曲线、校准曲线和决策曲线分析评估各模型对胃癌LVI的预测效能及临床效益。结果(1)训练集与验证集间比较,年龄、性别、身高、体质量、体质量指数、癌胚抗原、糖类抗原199、病灶位置、分化程度差异均无统计学意义(P值均>0.05)。上述指标在验证集中LVI阳性组与阴性组比较,差异均无统计学意义(P值均>0.05);训练集中2组间仅癌胚抗原、分化程度差异有统计学意义(χ^(2)=6.74、10.18,P值均<0.05)。(2)基于静脉期增强CT图像最终筛选出10个关键特征用于构建影像组学模型。其中,RF影像组学模型预测效能最佳,在训练集和验证集的曲线下面积(AUC)分别为0.831(95%CI:0.809~0.839)和0.812(95%CI:0.765~0.828),准确度、灵敏度和特异度在训练集和验证集中均优于XGB、SVM和LR机器学习方法构建的模型。(3)胃癌LVI的独立危险因素包括病灶位置和分化程度,以此构建临床模型。RF影像组学模型、临床模型和融合模型在训练集的AUC分别为0.831、0.625、0.839,验证集对应的AUC分别为0.812、0.623、0.829。校准曲线分析显示,融合模型有良好的校准效能。决策曲线分析证实融合模型净收益值更大。结论基于增强CT图像构建的RF影像组学模型及其与临床独立危险因素联合建立的融合模型,对于胃癌LVI均有良好的术前预测价值,并且后者的预测效能相对更高。