关键词:
胆囊肿瘤
神经浸润
增强CT检查
机器学习
预测模型
摘要:
目的探讨基于增强CT检查联合临床特征构建胆囊癌神经浸润机器学习预测模型的应用价值。方法采用回顾性队列研究方法。收集2010年1月至2024年6月新乡医学院第一附属医院收治的502例胆囊癌患者的临床影像资料;男171例,女331例;年龄为65(35~91)岁。患者均行术前腹部增强CT检查及胆囊癌根治性切除术。502例患者以7∶3比例随机分为训练集351例和测试集151例,训练集用于构建预测模型,测试集用于验证模型效能。观察指标:(1)胆囊癌神经浸润情况及影响因素分析。(2)胆囊癌神经浸润机器学习预测模型构建及评价。计数资料组间比较采用χ^(2)检验。等级资料组间比较采用Mann-Whitney U检验。单因素和多因素分析采用Logistic回归模型。纳入独立影响因素应用基于python 3.9的标准库模块构建机器学习模型,绘制受试者工作特征(ROC)曲线并计算灵敏度、特异度、准确度、曲线下面积(AUC)、精确率、F1评分、阳性预测率、阴性预测率、Kappa值评估模型的预测效能。测试集中不同模型AUC差异采用Delong检验评估,使用Hosmer-Lemeshow检验和Brier分数判断模型的校准度。结果(1)胆囊癌神经浸润情况及影响因素分析。502例胆囊癌患者中,131例有神经浸润,371例无神经浸润。多因素分析结果显示:总胆红素、癌胚抗原、CA199、CA125、中性粒细胞与淋巴细胞比值、CT检查肝侵犯、CT检查血管侵犯、CT检查肝门部或腹膜后淋巴结转移和肿瘤T分期为T3、T4期是胆囊癌患者神经浸润的独立影响因素[比值比=3.747、2.395、3.917、3.596、2.805、2.377、3.523、2.774、5.080、6.809,95%可信区间(CI)为1.890~7.430,1.154~4.971,2.054~7.472,1.807~7.155,1.506~5.225,1.241~4.553,1.666~7.449,1.483~5.189,2.050~12.589,2.552~18.168,P<0.05]。(2)胆囊癌神经浸润机器学习预测模型的构建与评价。纳入独立影响因素构建逻辑回归、K-最近邻、支持向量机、随机森林、决策树、反向传播神经网络和梯度提升机7种机器学习模型,绘制测试集ROC曲线,AUC分别为0.900(95%CI为0.851~0.948)、0.741(95%CI为0.646~0.829)、0.836(95%CI为0.762~0.895)、0.782(95%CI为0.701~0.855)、0.839(95%CI为0.770~0.901)、0.817(95%CI为0.738~0.887)、0.843(95%CI为0.770~0.909)。Delong检验结果显示:逻辑回归模型AUC最高。逻辑回归模型灵敏度和特异度分别为0.868和0.805,平衡性最佳。Hosmer-Lemeshow检验结果显示:逻辑回归模型拟合优度较好(χ^(2)=5.320,P>0.05)。逻辑回归模型Brier分数较低,为0.168,验证了其校准优势。结论总胆红素、癌胚抗原、CA199、CA125、中性粒细胞与淋巴细胞比值、CT检查肝侵犯、CT检查血管侵犯、CT检查肝门部或腹膜后淋巴结转移和肿瘤T分期为T3、T4期是胆囊癌患者神经浸润的独立影响因素。基于增强CT检查联合临床特征构建的7种机器学习模型可预测胆囊癌神经浸润,其中逻辑回归模型预测性能较佳。