关键词:
痛风
程序性细胞死亡
免疫浸润
生物信息学分析
机器学习
摘要:
目的通过生物信息学和机器学习筛选痛风程序性细胞死亡(PCD)关键基因以及免疫浸润分析。方法从GEO数据库中下载痛风相关数据集,其中包括人源痛风相关的GSE160170数据集及鼠源痛风相关的GSE190138数据集作为训练集。以差异倍数>2倍,P<0.05为标准,筛选出差异表达基因(DEGs)。将两个数据集的DEGs取交集,获得共同的DEGs。对共同DEGs进行基因本体功能注释(GO)和京都基因与基因组百科全书(KEGG)富集分析。将共同DEGs与PCD相关基因集取交集,获得PCD相关DEGs。在STRING数据库中构建PPI网络。在Cytoscape中的MCODE筛选关键模块基因,Cytohubba插件内置的12种算法(Degree,MCC,DMNC,MCN,EPC,BottleNeck,EcCentricity,closness,Radiality,Betweeness,Stress,Clusteringcoefficoent)筛选枢纽基因,两者的共同基因作为候选基因。采用最小绝对收缩和选择算法(LASSO)回归模型分别筛选GSE160170和GSE190138数据集中关键基因,二者取交集,获得关键基因。采用受试者工作特征(ROC)曲线评价关键基因对痛风的诊断价值。采用单样本基因集富集分析(ssGSEA)免疫浸润分析,探讨痛风相关的免疫细胞的表达差异。收集2024年2~4月西安市第五医院风湿科收治的30例痛风病人作为实验组,同时收集30例健康体检者为对照组,提取外周血单个核细胞(PBMC)RNA,采用实时荧光定量聚合酶链反应(RT-qPCR)对关键基因表达进行验证。结果获得GSE160170和GSE190138共同DEGs 53个,其中基因表达上调43个,表达下调10个。GO和KEGG表明大多数基因参与了细胞死亡、凋亡、白细胞介素(interleukin,IL)-17信号通路、肿瘤坏死因子(TNF)信号通路和核苷酸结合寡聚结构域(NOD)样受体信号通路等。获得PCD与痛风共同DEGs 12个,MCODE筛选关键模块和Cytohubba内置的12种算法共筛选7个候选基因,LASSO回归模型在两个数据集中分别筛选出5个基因和4个基因,二者取交集获得关键基因3个,分别为IL-6,纤溶酶激活物尿激酶受体(PLAUR),NOD受体热蛋白结构域相关蛋白3(NLRP3)。在训练集中进行验证,受试者工作特征(ROC)曲线结果表明这三个基因对痛风诊断的曲线下面积(AUC)均为1.00。免疫浸润分析显示活化的CD4^(+)T细胞、活化的CD8^(+)T细胞和自然杀伤(NK)细胞等的改变与痛风的发生发展密切相关。在临床样本中进行验证,与对照组比较,PLAUR,NLRP3和IL-6在痛风患者中均为高表达,差异具有统计学意义(t=18.852,9.633,8.293,均P<0.001)。结论IL-6,PLAUR,NLRP3为痛风的诊断和治疗提供了潜在的生物标志物和治疗靶点,为痛风的诊断和治疗提供了新的方向。