关键词:
NK/T细胞淋巴瘤
SEER数据库
列线图
机器学习
随机生存森林
生存预测
摘要:
目的探讨NK/T细胞淋巴瘤(natural killer T-cell lymphoma,NKTL)患者的生存预后影响因素。基于随机生存森林(random survival forest,RSF)算法,构建预测NKTL患者总生存期(overall survival,OS)的预后模型。方法从SEER数据库收集2000-2020年的NKTL患者的人口统计学和临床病理资料。按照7∶3的比例将患者划分为训练队列(n=471)和验证队列(n=203)。通过Cox回归分析确定影响患者OS的预后因素,并基于分析结果构建列线图模型。同时,使用RSF算法确定影响患者OS的预后因素,并构建RSF模型。采用ROC曲线、校准曲线和决策曲线、净重新分类指数(net reclassification improvement,NRI)和综合判别改善指数(integrated discrimination improvement,IDI)对模型的预测能力进行评估,并比较2种模型的预测效果。通过2种模型计算每位患者的风险得分,根据风险得分的中位数,将患者分为高风险组和低风险组,并绘制生存曲线进行比较。结果Ann Arbor分期、年龄、放疗、联合治疗和疾病类型是与生存显著相关的预后变量。在验证队列中,列线图模型的1、3和5年ROC曲线下面积(area under curve,AUC)分别为0.745、0.771和0.748,而RSF模型的AUC为0.764、0.792和0.761。ROC曲线显示2种模型在预测OS方面具有良好的准确性和区分性。校准曲线显示2种模型预测的生存与实际生存之间具有良好的一致性。两种模型均能有效地将患者分为预后差组和预后好组,并且预后差组患者的OS显著低于预后好组(P<0.0001)。决策曲线显示RSF模型的净获益优于列线图模型。与列线图模型相比,RSF模型的NRI为0.184(95%CI:0.098~0.267,P<0.01),IDI为0.300(95%CI:0.241~0.359,P<0.01),RSF模型的预测能力优于列线图模型。结论Ann Arbor分期、年龄、放疗、联合治疗和疾病类型是NKTL患者预后的影响因素,本研究据此建立的RSF模型对NKTL患者预后具有很好的预测能力,可有效评估患者预后。