本文档属于类型a,即报告了一项原创性研究的科学论文。以下是对该研究的详细介绍:
本研究由Guochong Jia、Zhishan Chen、Jie Ping等多名研究人员共同完成,研究团队来自多个国际知名机构,包括Vanderbilt University Medical Center、National Cancer Institute、Boston University等。该研究于2024年发表在《Nature Genetics》期刊上。
乳腺癌是全球女性中最常见的癌症之一,基因组关联研究(GWAS)已识别出约200个与乳腺癌风险相关的遗传区域。然而,这些区域中的因果变异及其靶基因大多尚未明确。本研究旨在通过多祖先群体的精细定位分析,进一步解析这些风险区域中的因果变异和靶基因,以揭示乳腺癌的遗传学和生物学机制。
研究流程包括以下几个主要步骤:
研究纳入了来自非洲、亚洲和欧洲血统的172,737名乳腺癌患者和242,009名对照者的GWAS数据。这些数据来自乳腺癌协会联盟(BCAC)、亚洲乳腺癌联盟(ABCC)和非洲血统乳腺癌遗传联盟(AABCG)。
研究首先进行了多祖先群体的荟萃分析,识别出192个乳腺癌风险区域。这些区域包括181个与总体乳腺癌风险相关的区域和11个与特定乳腺癌亚型(如雌激素受体阳性乳腺癌)相关的区域。
使用贝叶斯统计方法(SuSiEx)对每个风险区域进行精细定位,识别出332个独立的关联信号,并确定了5,326个可信因果变异(CCVs)。其中,50个信号的可信因果变异被缩小到单个变异。
通过整合功能基因组学数据,研究识别出195个潜在的易感基因,这些基因在PI3K/AKT、TNF/NF-κB、p53和Wnt/β-catenin等信号通路中富集。此外,单细胞RNA测序和体外实验数据为105个基因提供了额外的功能证据。
研究构建了一个基于多祖先群体荟萃分析的多基因风险评分(PRS),并在不同血统的验证数据集中评估了其预测性能。结果显示,该PRS在非欧洲血统群体中表现优于先前基于欧洲血统的PRS。
研究的主要结果包括: - 识别出192个乳腺癌风险区域,其中7个是先前未报道的新区域。 - 确定了332个独立的关联信号和5,326个可信因果变异。 - 通过功能基因组学分析,识别出195个潜在的易感基因,其中140个被归类为高置信度的效应基因。 - 这些基因在多个癌症相关信号通路中富集,包括PI3K/AKT、TNF/NF-κB和p53通路。
本研究通过多祖先群体的精细定位分析,揭示了乳腺癌风险区域中的因果变异和靶基因,为理解乳腺癌的遗传学和生物学机制提供了新的见解。研究结果表明,多祖先数据的整合能够提高精细定位的分辨率,特别是在非洲血统群体中。此外,研究还支持了先前与乳腺癌肿瘤发生相关的基因在乳腺癌遗传易感性中的潜在作用。
研究还通过体外实验和单细胞RNA测序数据,进一步验证了部分候选基因的功能,为这些基因在乳腺癌中的生物学作用提供了实验证据。此外,研究还构建了一个多基因风险评分,展示了其在非欧洲血统群体中的优越性能。
总之,本研究通过多祖先群体的精细定位分析,揭示了乳腺癌风险区域中的因果变异和靶基因,为乳腺癌的遗传学和生物学研究提供了重要的新见解。