关键词:
肝细胞癌
磁共振成像
影像组学
机器学习
病理分级
摘要:
目的探索多期相MRI影像组学联合不同机器学习模型预测肝细胞癌(hepatocellular carcinoma,HCC)风险分层的价值。材料与方法回顾性分析我院2020年1月至2024年12月术后病理诊断为HCC,且符合纳入和排除标准的120例患者的临床和影像资料。依据Edmondson-Steiner分级(ES分级)划分为低级别(ESⅠ级、Ⅰ/Ⅱ级)组和高级别(ESⅡ级、Ⅱ/Ⅲ级、Ⅲ级、Ⅲ/Ⅳ级、Ⅳ级)组,其中高级别组91例、低级别组29例。然后按7∶3随机划分为训练集84例(高级别组60例、低级别组24例)和验证集36例(高级别组31例、低级别组5例)。使用ITK-SNAP软件在动脉期图像上勾画HCC全域感兴趣区(region of interest,ROI),然后以动脉期为模板,对门静脉和延迟期进行配准,共用动脉期勾画的ROI。基于PyRadiomics软件包共提取3396个组学特征,先后采用Spearman相关性分析、最大相关性-最小冗余(maximum relevance-minimum redundancy,mRMR)和最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归进行数据降维并选择最佳特征,随后构建逻辑回归(logistic regression,LR)、支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、朴素贝叶斯(naive Bayes,NB)和多层感知器(multilayer perceptron,MLP)五种机器学习算法的影像组学模型,选择最优模型,再结合临床影像特征,最终建立含有临床影像特征和影像组学特征的组合模型。使用受试者工作特性(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)、准确度、敏感度、特异度、阳性预测值(positive predictive value,PPV)、阴性预测值(negative predictive value,NPV)、校准曲线、决策曲线分析(decision curve analysis,DCA)评估模型的性能。结果从三个期相分别提取1132个影像组学特征,经降维筛选后共纳入8个影像组学特征(动脉期2个、门静脉期3个和延迟期3个)构建影像组学模型,LR、SVM、RF、NB、MLP五种算法模型预测HCC病理分级训练集和验证集的AUC值分别为0.899、0.897、0.893、0.814、0.876和0.865、0.845、0.590、0.723、0.735,表明LR模型具有最好的性能和稳定性。单因素和多因素logistic回归分析发现年龄(P=0.046)和甲胎蛋白(P=0.031)是HCC病理分级的预测因子。年龄、甲胎蛋白与影像组学模型融合的组合模型在训练集AUC为0.929,验证集AUC为0.884。DeLong检验显示,训练集中临床模型与影像模型、组合模型之间差异具有统计学意义(P<0.05),影像模型与组合模型之间差异无统计学意义(P>0.05);验证集中三个模型之间差异均无统计学意义(P>0.05)。校准曲线表明组合模型在训练集和验证集的预测概率与实际概率更接近。DCA提示组合模型在合理的阈值概率范围内提供了更大的净收益。结论基于多期相动态增强MRI影像组学结合临床影像学特征的组合模型可准确预测HCC的风险分层。