阿尔茨海默病进程中细胞类型特异的转录组模块建模

概述

Communications Biology上发表了一篇题为“supervised latent factormodeling isolates cell-type-specific transcriptomicmodules that underlie alzheimer’s diseaseprogression”的文章。本文由Liam Hodgson、Yue Li、Yasser Iturria-Medina、Jo Anne Stratton、Guy Wolf、Smita Krishnaswamy、David A. BennettDanilo Bzdok等来自McGill University、Université de Montréal、Yale University和Rush University Medical Center等机构的研究人员合作完成。文章通过监督潜在因子建模的方法,探索了阿尔茨海默氏症(AD)相关的细胞类型特异性转录组模块。

研究背景

晚发性阿尔茨海默氏症(AD)是一种逐步恶化的神经退行性疾病,其脑部变化在症状出现前数年就已经开始。虽然神经元丧失是AD的经典特征,但基因组广泛关联研究(GWAS)和最近的单核RNA测序(snRNA-seq)研究已经指出胶质细胞,特别是小胶质细胞,在AD病理生理学中起着重要作用。本研究旨在通过整合整个转录组,利用模式学习算法来探索大脑主要细胞类型中分布的AD预测模块。

研究目的

研究的目的是设计和实现一种监督潜在因子框架,从而提高snRNA-seq转录组效应在AD的特异性基因表达程序粒度上的可解释性。通过此方法,研究人员希望识别出特定细胞类型中的疾病驱动基因模块,并阐明这些模块在AD预测中的生物学意义。

研究方法

本研究采用了一种监督潜在因子建模方法,使用偏最小二乘判别分析(PLS-DA)模型对Rosmap研究队列中的单核RNA测序数据进行了分析。具体步骤如下:

  1. 数据准备与预处理:从Rosmap项目中获取样本,涉及48个年龄和性别匹配的供体,约70,000个细胞。
  2. 模型训练:为每种细胞类型(包括兴奋性神经元、抑制性神经元、少突胶质细胞、少突胶质前体细胞、小胶质细胞和星形胶质细胞)分别训练单独的PLS-DA模型,以从基因表达数据中区分AD患者和非AD患者的细胞。
  3. 模块识别:使用经典的基因程序数据库对每个PLS-DA模块进行基因集合富集分析(GSEA),以识别与AD预测相关的特定生物过程和分子通路。
  4. 验证与评估:使用5折交叉验证方法评估模型性能与模块识别的准确性,并进行伪进程排序以推断疾病进展情况。

研究结果

通过上述方法,研究团队得到了以下主要结果:

  1. 细胞类型特异性基因模块:在所有六种细胞类型中(包括兴奋性神经元、抑制性神经元等),发现了由少数基因组成的细胞类型特异性模块,这些模块能够有效地区分健康细胞和AD细胞。例如,小胶质细胞中发现的主要预测模块富含与小胶质细胞激活、吞噬作用和响应淀粉样β斑块相关的基因程序。星形胶质细胞的主要预测模块则与细胞外基质组织、细胞连接组装等相关。
  2. 互作分析:进一步分析了不同细胞类型中模块间的相互作用,发现兴奋性和抑制性神经元之间存在高度协调的基因程序活动,星形胶质细胞与这两类神经元也有显著的互动。这提示不同细胞类型在AD中的功能联系和响应机制的差异。
  3. 创新发现:利用伪进程排序,推断出了AD患者的疾病进展轨迹,并通过已知的临床和病理指标(如Braak阶段和CERAD评分)验证了此轨迹的有效性。结果显示,伪进程与这些外部疾病指标有很强的绝对Spearman相关。
  4. GWAS风险基因定位:在研究中进一步探讨了基因组广泛关联研究(GWAS)中已知的38个AD风险位点,发现其中的几个风险基因位点在某些特定细胞类型模块中具有显著影响。例如,APOE基因主要出现在星形胶质细胞、小胶质细胞和少突胶质前体细胞的模块中,而PICALM基因则在所有细胞类型模块中均有所表现。

结论及意义

本研究的主要结论是,通过采用监督潜在因子建模,能够识别出特定细胞类型中的AD预测基因模块,并揭示这些模块在疾病进展中的重要作用。此方法强调了在单核RNA测序数据中同时考虑所有基因表达以隔离多种潜在基因表达模块的价值,为进一步理解AD的病理机制提供了新的视角。

此外,研究结果强调了小胶质细胞在AD发病机制中的重要作用,并提示了可能的细胞间功能协调方式,为未来的研究提供了新的方向。例如,TLR2、TLR1和TLR5在小胶质细胞中的激活是通过MAPK/ERK信号通路,这一发现有助于开发针对AD的潜在治疗策略。

最后,通过将已知的AD风险基因与特定细胞类型和基因程序模块联系起来,研究揭示了这些风险基因在不同细胞类型中的独特作用,进一步支持了使用单核转录组学数据进行AD研究的价值。

本研究通过多层次的分析框架,不仅扩展了对AD发病机制的理解,还展示了机器学习在单细胞基因组学中的潜在应用。研究结果有望为开发新的诊断和治疗手段提供理论基础。