分享自:

发现免疫相关的诊断性生物标志物及多囊卵巢综合征诊断模型的构建

期刊:archives of gynecology and obstetricsDOI:10.1007/s00404-022-06686-y

学术报告

这篇名为《Discovery of immune‑related diagnostic biomarkers and construction of diagnostic model in varies polycystic ovary syndrome》的研究文章,由Junjie Qu、Bilan Li、Meiting Qiu、Jingyun Wang、Zhiqin Chen及Kunming Li等作者完成,主要研究机构是上海交通大学医学院附属第一妇婴保健院的生殖医学科和妇科,通讯作者为Xiaoming Teng(联系邮箱为jennydyfy@163.com)。该文章发表于Springer旗下刊物《Archives of Gynecology and Obstetrics》,在2022年7月29日在线发布,文献的DOI为:https://doi.org/10.1007/s00404-022-06686-y。

研究背景与目标

本研究聚焦于妇产科学领域,特别是围绕多囊卵巢综合征(Polycystic Ovary Syndrome,PCOS)的诊断问题展开。PCOS是一种异质性的疾病,其特征为雄激素过多与卵巢功能障碍的复杂症状。这种疾病不仅影响到女性的生育能力,还与胰岛素抵抗、肥胖和心血管疾病等一系列健康问题密切相关。然而,到目前为止,PCOS在临床上尚没有统一的诊断标准,尤其在青少年和更年期阶段仍存在诊断难题。此外,这种疾病的病因和发病机制仍不明确。基于遗传学、生活习惯等因素的研究仅能部分解释其复杂性,而越来越多的研究数据表明,PCOS与免疫反应密切相关。一些细胞因子及免疫细胞对PCOS的发生、发展可能具有重要作用。因此,本研究旨在通过多组学数据分析,尝试寻找免疫相关的诊断生物标志物,并建立基于这些标志物的诊断模型(Nomogram),为临床应用提供理论基础。

研究方法与流程

研究流程主要分为以下几个步骤:

数据收集与整合

研究首先从GEO数据库(Gene Expression Omnibus)中下载了六个PCOS相关的数据集,包括GSE95728、GSE114419、GSE106724、GSE137684、GSE10946,以及GSE5090。通过R软件中的SVA包去除了批次效应,将数据集整合为两部分:一个训练集和一个验证集。整合后的训练集包含6951个基因表达数据,而验证集则用于独立验证模型。

同时,研究还从Immunology Database and Analysis Portal (ImmPort)中获取了共计1181个免疫相关基因(Immune-Related Genes, IRGs)。

差异基因及基因模块识别

通过limma包分析,研究找出了训练集中PCOS组和对照组之间的97个差异表达基因(Differentially Expressed Genes, DEGs)。随后,通过加权基因共表达网络分析(Weighted Gene Co-Expression Network Analysis, WGCNA),识别出与PCOS显著相关的棕色模块。将棕色模块中的基因与DEGs进行取交集后,共筛选出74个差异模块基因(Differentially Expressed Module Genes, DEMGs)。

功能富集分析

研究对筛选的74个DEMGs进行功能富集分析,包含GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)分析。结果显示,这些基因主要参与免疫反应、炎症反应、中性粒细胞趋化、以及免疫反应调控等生物学过程。同时,这些基因与细胞因子-细胞因子受体相互作用(Cytokine-Cytokine Receptor Interaction)、趋化因子信号通路(Chemokine Signaling Pathway)等通路密切相关。

生物标志物的鉴定及模型选择

研究通过交叉分析74个DEMGs和1181个IRGs,筛选出7个差异免疫相关基因(Differentially Immune-Related Genes, DIRGs),具体为:CAMP、S100A9、CD40LG、S100P、IL6R、TLR8和S100A8。随后,研究利用随机森林模型(Random Forest, RF)、支持向量机模型(Support Vector Machine, SVM)以及广义线性模型(Generalized Linear Model, GLM)对这些基因进行建模。通过分析各模型的残差分布,随机森林模型因其最小的样本残差被选为最优模型。最终,4个最优生物标志物(CAMP、S100A9、TLR8、IL6R)被选出用于后续分析。

诊断模型的构建

使用RMS包基于四个关键生物标志物构建了PCOS的诊断模型(Nomogram)。通过校准曲线、决策曲线分析(Decision Curve Analysis, DCA)及临床影响曲线(Clinical Impact Curve Analysis, CICA)评价了模型的准确性、预测能力和临床效用。ROC曲线结果显示,诊断模型在训练集(AUC = 0.878)和验证集(AUC = 0.764)中均表现良好,预测效果优异。

免疫细胞分布分析

采用CIBERSORT算法计算训练集中22种免疫细胞类型的相对比例,并分析四个关键生物标志物与免疫细胞分布的相关性。结果发现,PCOS患者中性粒细胞(Neutrophils)、静息NK细胞(Resting NK Cells)和活化树突状细胞(Activated Dendritic Cells)的浸润丰度有所升高。此外,中性粒细胞、树突状细胞等免疫细胞的丰度与关键基因的表达呈现正相关。

研究结果与意义

本研究通过高通量转录组数据分析和机器学习方法,确定了CAMP、S100A9、TLR8和IL6R四个具有诊断价值的免疫相关生物标志物。这些基因在PCOS患者中均表现为高表达,其潜在作用机制可能与炎症反应和免疫细胞失调密切相关。尤其是中性粒细胞的增多和功能变化,可能在PCOS的免疫病理中起到核心作用。

通过整合多组学数据和机器学习方法,研究建立的诊断模型可为PCOS的早期诊断提供科学依据,并为临床应用提供操作性强的工具。同时,该研究也为进一步探讨免疫相关通路在PCOS中的作用机制提供了线索。

研究亮点

  1. 首次确定了CAMP、S100A9、TLR8和IL6R四个免疫相关基因作为PCOS诊断的关键标志物。
  2. 结合多组学数据和机器学习算法,构建了具有高效率和准确性的诊断模型。
  3. 独特地分析了PCOS与免疫细胞浸润的关系,为进一步的免疫病理研究提供了新视角。
  4. 提供了从基础研究向临床转换的洞察,为PCOS的精准医学发展奠定了理论基础。

研究局限与展望

虽然本研究在理论和方法上具有显著创新性,但仍存在样本量偏小的问题,诊断模型的临床推广应用需进一步验证。此外,对于上述四个标志物的功能机制,还需要更深入的实验研究予以验证。

总结

本研究通过深度挖掘PCOS与免疫反应之间的关联,提出了一种以CAMP、S100A9、TLR8和IL6R为核心的诊断模型,充分体现了多组学整合和人工智能算法在疾病诊断中的优势。这项研究不仅为PCOS的早期检测和诊断提供了新思路,同时也为探索新型治疗靶点开辟了可能的方向。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com