关键词:
脓毒症
加权基因共表达网络
机器学习算法
METTL7B
焦亡基因
摘要:
目的利用加权基因共表达网络分析(WGCNA)与机器学习算法筛选脓毒症预后焦亡相关基因,并验证其在脓毒症模型中的表达。方法从基因表达综合数据库(GEO)下载GSE95233基因数据集作为训练集,GSE65624基因数据集、GSE167363单细胞转录测序数据集作为验证集,筛选脓毒症组与正常对照组差异表达基因(DEGs)。利用焦亡相关基因,采用ConsensusClusterPlus R包进行无监督聚类,根据聚类分组在数据集中筛选焦亡相关差异基因。利用WGCNA筛选与脓毒症预后最相关的模块特征基因。脓毒症差异基因、焦亡相关差异基因结合模块特征基因,通过韦恩图(Venn diagram)得到与脓毒症预后相关的候选基因。采用最小绝对收缩与选择算子(Lasso)回归、随机森林(RF)及支持向量机(SVM)分析筛选出脓毒症预后焦亡关键基因METTL7B。对训练集GSE95233及验证集GSE65624中的关键基因METTL7B进行诊断和预后受试者工作特征(ROC)曲线及生存曲线分析。最后基于数据集GSE167363高通量测序数据分析展示METTL7B在脓毒症巨噬细胞的表达情况,并通过RT-PCR技术验证METTL7B在脓毒症造模巨噬细胞中的表达。结果筛选出脓毒症差异表达基因203个、焦亡相关差异基因689个及模块特征基因891个,通过韦恩图得到14个脓毒症预后相关候选基因。随后利用Lasso回归、支持向量机及随机森林分析对上述14个重叠基因进行筛选。Lasso回归模型中保留了6个非零系数的特征基因。随机森林算法显示当特征基因数为5时,模型准确度最高。SVM显示当特征基因数为4时,10折交叉验证误差最小。最后通过韦恩图筛选出脓毒症预后潜在焦亡关键基因METTL7B。在训练集GSE95233中METTL7B诊断及预后的AUC分别为0.990、0.702,验证集GSE65624中诊断AUC为0.939,且在该数据集,高表达METTL7B的脓毒症患者有更高的生存率。通过对GSE167363单细胞转录测序分析发现METTL7B在巨噬细胞中表达,进一步在体外实验验证了脓毒症造模巨噬细胞中METTL7B的表达升高(P<0.05)。结论通过WGCNA与机器学习算法筛选的脓毒症预后相关焦亡关键基因METTL7B,可能成为脓毒症预后标志物。