关键词:
肺结节
液体生物标志物
体质
口腔微生物
16S rRNA测序
机器学习
摘要:
血瘀质是肺癌的高风险体质类型,在肺癌发生的早期阶段——肺结节,特别关注血瘀质人群具有重要意义.本研究旨在基于口腔微生物特征构建血瘀质肺结节良恶性诊断模型,识别血瘀质肺结节早期恶性诊断的新型非侵入性生物标志物,并了解口腔菌群的变化在肺结节恶性演进中的潜在作用.研究收集了肺结节患者的唾液样本及中医体质信息,并将血瘀质良性(n=136)和恶性肺结节(n=73)患者作为研究对象.运用16S r RNA基因测序技术和7种机器学习算法(logistic regression、support vector machine、multi-layer perceptron、na?ve bayes、random forest、gradient boosting decision trees、light gradient boosting machine(lightGBM)),揭示血瘀质良恶性肺结节患者的口腔微生物组特征,并确定区分血瘀质良恶性肺结节的最佳预测模型和关键微生物标志物.最后,基于PICRUSt2菌群功能预测分析,探索口腔微生物群在肺结节恶性演进中的潜在作用机制.研究发现,与血瘀质良性肺结节相比,恶性肺结节患者的唾液微生物α和β多样性显著降低(P<0.05),且物种组成更少.LightGBM是预测血瘀质肺结节良恶性表现最优的机器学习模型(area under curve(AUC)=0.893,95%CI:0.866~0.925).Granulicatella、Fusobacterium、Delftia、Streptococcus、Alloprevotella、Veillonella可作为血瘀质肺结节良恶性诊断的潜在生物标志物.此外,在血瘀质恶性肺结节患者中,唾液微生物群可能存在有趣的代谢重编程.因此,唾液微生物可作为血瘀质恶性肺结节的非侵入性、高灵敏度鉴别诊断生物标志物,为我国肺癌的临床诊疗提供一种更加精准、个体化的新方法.