关键词:
糖尿病视网膜病变
血管生成
机器学习
生物标志物
免疫细胞浸润
摘要:
目的基于转录组学挖掘糖尿病视网膜病变(DR)中与血管生成基因(ARGs)相关的生物标志物。方法通过差异表达分析筛选出DR患者群体与健康对照群体间的差异表达基因(DEGs)。运用加权基因共表达网络分析识别出与ARGs最显著相关的关键模块。将DEGs与此关键模块中的基因做交集处理,得到了一系列的候选基因。其次,操纵3款不同的机器学习算法从这些候选基因中挑选出有潜力的DR生物标志物并基于这些标志物构建出用于DR诊断的列线图模型,通过绘制并分析接受者操作特征曲线(ROC),校准曲线以及决策曲线分析曲线,进一步验证列线图模型预测的准确性。此外,研究DR组患者和对照组之间的免疫细胞浸润情况,同时,预测针对DR治疗的潜在靶向生物标志物的化学药物。结果基于生物信息学分析,共鉴定出153个DEGs和969个关键模块基因。以上两种结果取交集获得19个候选基因。3种机器学习算法确定了4个生物标志物[血清淀粉样蛋白A2(SAA2)、内质网驻留蛋白27(ERP27)、谷胱甘肽过氧化物酶8(GPX8)和RAB蛋白家族成员RAB7B],ROC曲线证实此4个生物标志物具有有效区分DR患者和正常人的能力。根据此4种生物标志物构建的列线图模型,能够有效预测DR的患病概率。免疫细胞浸润结果表明,4种生物标志物与28种免疫细胞之间均展现出较强的相关性。药物预测发现,分别靶向SAA2和GPX8的地塞米松、二硫化谷胱甘肽和谷胱甘肽可能是治疗DR的潜在药物。结论SAA2、ERP27、GPX8和RAB7B可建立诊断DR的可靠模型,这些生物标志物主要参与补体和凝血级联反应,以及调控免疫细胞浸润等关键生物学过程。