关键词:
阳虚质
强直性脊柱炎
生物信息学
机器学习
生物标志物
摘要:
目的:利用生物信息学与机器学习筛选阳虚质强直性脊柱炎(AS)中的关键基因。方法:从GEO数据库获取GSE87474中平和质和阳虚体质人群的数据以及AS相关的数据集GSE181364。分别利用Limma包和Wilcox Test筛选数据集中的差异表达基因(DEGs),并将两类DEGs进行交集,确定阳虚质AS相关基因。使用支持向量机-递归特征消除(SVM-RFE)和最小绝对值收敛与选择算子(LASSO),识别阳虚质AS相关基因中的关键基因,并利用pROC包绘制关键基因的受试者工作特征(ROC)曲线,以评价其诊断效能。结果:从GSE87474数据集中筛选出455个与阳虚质相关的DEGs,从GSE181364数据集中筛选出1525个与AS相关的DEGs,两者取交集后获得16个阳虚质AS相关基因,Lasso与SVM-RFE算法从16个相关基因中鉴定出5个关键基因,即纺锤家族成员4(SPIN4)、跨膜蛋白68(TMEM68)、锌指蛋白92(ZNF92)、瘦素受体重叠转录样1(LEPROTL1)、G蛋白偶联受体183(GPR183)。ROC分析结果显示,5个关键基因均表现出良好的诊断阳虚质和AS的效能。结论:发现SPIN4、TMEM68、ZNF9、LEPROTL1、GPR183可能为阳虚质AS的潜在关键基因,可为进一步阐明阳虚质AS的生物学机制及潜在临床诊断标志物,为从中医体质“体病相关”学说论治AS提供新的思路。