血浆纤维蛋白原的全基因组分析揭示具有肝脏作用的种群分化遗传调控因子

血浆纤维蛋白原的全基因组分析揭示种群分化的遗传调控因子及其在肝脏中的潜在作用

学术背景

纤维蛋白原(fibrinogen)是一种关键的凝血因子和急性期反应蛋白。在正常生理条件下,纤维蛋白原在血液循环中含量丰富,但在急性炎症反应期间,白细胞介素-6(IL-6)和IL-1介导的转录级联反应会使其水平升高至基线的3倍。纤维蛋白原水平是血栓性疾病(如冠心病、心肌梗死、静脉血栓栓塞和缺血性卒中)的临床预测因子。尽管动物模型已证明纤维蛋白原与血栓形成之间存在因果关系,但在人类遗传学研究中这一关系难以确认。

纤维蛋白原水平的遗传性估计在21%至67%之间,大多数估计值在30%至50%之间,且在不同人群中存在异质性。非洲裔美国人的纤维蛋白原基线水平较高,且其遗传性可能高于非西班牙裔白人。尽管全基因组和外显子组测序研究已确定了多个与纤维蛋白原水平相关的基因位点,但这些变异在欧洲人群中最多只能解释3.7%的变异。关于纤维蛋白原在不同人群中的遗传调控机制知之甚少。

与基因分型芯片相比,全基因组测序(WGS)能够对所有人群进行非靶向基因组检测,提高了对稀有和低频变异的检测能力,并能够区分同一区域内的多个信号。本研究通过整合美国国家心肺血液研究所(NHLBI)的“精准医学跨组学”(TOPMed)项目的WGS数据和“心脏与衰老研究基因组流行病学联盟”(CHARGE)的基因分型数据,旨在识别与循环纤维蛋白原水平相关的新遗传变异。

论文来源

本论文由Jennifer E. HuffmanJayna NicholasJulie Hahn等来自多个研究机构的学者共同撰写,发表于2024年11月21日的《Blood》期刊(第144卷,第21期)。研究团队来自多个知名机构,包括Palo Alto VA Institute for ResearchUniversity of North Carolina at Chapel HillUniversity of Texas Health Science Center at Houston等。

研究流程

1. 研究设计与样本

本研究通过多人群全基因组关联分析(GWAS)、转录组关联分析(TWAS)和表型组关联分析(PheWAS)来探究循环纤维蛋白原的遗传结构。研究共纳入了163,912名参与者,包括11,283名非洲裔、741名亚洲裔、149,619名欧洲裔和2,061名西班牙裔参与者。纤维蛋白原水平通过Clauss法或免疫比浊法等方法测量。

2. 全基因组测序与基因分型

TOPMed项目的WGS数据由6个测序中心完成,平均测序深度超过30×。非TOPMed研究的基因分型数据使用TOPMed或单倍型参考联盟(HRC)参考面板进行插补。

3. 数据分析

  • 单变异分析:使用混合模型进行单变异分析,调整年龄、性别、人群组别、测序阶段和研究特定参数。
  • 条件分析:使用COJO-SLCT进行条件分析,计算95%可信集。
  • 功能注释:使用Ensembl变异效应预测器(VEP)对变异进行功能注释,包括预测的错义变异和调控区域。
  • 共定位分析:使用FASTENLOC进行基因-性状共定位分析,识别与纤维蛋白原相关的基因表达变异。
  • 转录组关联分析:使用S-PrediXcan进行TWAS,识别与纤维蛋白原水平相关的基因表达变异。
  • 表型组关联分析:在VA百万退伍军人计划(MVP)中,使用多基因风险评分(PRS)进行PheWAS,分析纤维蛋白原PRS与血栓和炎症相关表型的关联。

主要结果

1. 单变异分析

多人群单变异分析共识别出54个与循环纤维蛋白原相关的基因位点,其中18个位点是新发现的。这些位点中包含69个独立的变异,其中20个是新发现的。在纤维蛋白原基因簇(FGG、FGB、FGA)中,发现了7个独立的信号,其中一个新信号由非洲裔人群中常见的变异rs28577061驱动。

2. 功能注释

大多数信号包含与肝脏酶、血脂和血细胞计数相关的变异。23个信号包含与C反应蛋白(CRP)相关的变异。18个信号包含至少一个错义变异,13个信号包含预测有害的变异。52个信号与肝脏开放染色质区域重叠,42个信号与HepG2肝细胞中的基因增强子区域重叠。

3. 共定位分析

共定位分析识别出153个变异-组织对,表明这些变异与GTEx数据库中的表达数量性状位点(eQTL)共享遗传基础。46个区域-组织对显示出与纤维蛋白原区域的统计共定位。

4. 转录组关联分析

TWAS识别出64个基因-组织对与纤维蛋白原水平显著相关,其中15个基因通过精细定位进一步优先考虑。TNKS基因在肝脏分析中被优先考虑,AFT1、C5orf56、FGB、MS4A4E和SLC22A5在血液分析中被优先考虑。

5. 表型组关联分析

PheWAS结果显示,纤维蛋白原PRS与静脉血栓栓塞和痛风等血栓和炎症相关表型显著相关。去除FGG基因区域的变异后,痛风相关的表型显著性增加,而凝血缺陷相关的表型显著性降低。

结论

本研究通过整合WGS和基因分型数据,识别出69个独立的遗传变异,涉及54个基因位点,与循环纤维蛋白原水平相关。研究首次发现了由非洲裔人群驱动的常见变异与纤维蛋白原的关联,并揭示了多个与肝脏调控元件重叠的信号。这些发现为纤维蛋白原的遗传调控机制提供了新的见解,并强调了在不同人群中开展大规模遗传研究的重要性。

研究亮点

  • 新发现的遗传变异:本研究识别出18个新位点,涉及20个独立变异,扩展了对纤维蛋白原遗传调控的理解。
  • 种群分化的遗传变异:研究发现了多个在非洲裔人群中更为常见的变异,填补了以往研究中非欧洲人群代表性不足的空白。
  • 肝脏调控机制:许多信号与肝脏调控元件重叠,提示这些变异可能通过影响肝脏代谢和炎症通路来调控纤维蛋白原水平。
  • 临床应用价值:研究结果揭示了纤维蛋白原与血栓和炎症相关疾病的遗传关联,为未来的疾病预防和治疗提供了潜在的靶点。

研究意义

本研究通过大规模的全基因组测序和基因分型数据,揭示了纤维蛋白原的复杂遗传调控网络,特别是在不同人群中的遗传异质性。这些发现不仅增进了我们对纤维蛋白原生物学功能的理解,还为未来的功能研究和临床应用提供了重要的遗传基础。