利用多重功能数据减少代表性不足人群中的变异分类不平等

基因组医学领域面临的一个重要挑战是不同人群在基因变异分类上的不平等,尤其是对于非欧洲血统的个体。由于历史原因,大多数基因组研究和临床测序数据主要来自欧洲血统的个体,导致对其他血统个体的基因变异与疾病风险的理解存在显著不足。这种不平等不仅影响了诊断的准确性,还可能导致错误的医疗管理。例如,许多非欧洲血统的个体在基因检测中更可能被归类为“意义未明的变异”(VUS, Variants of Uncertain Significance),而欧洲血统的个体则更可能被归类为“致病性或可能致病性变异”(P/LP, Pathogenic or Likely Pathogenic)。这种差异不仅影响了临床决策,还加剧了健康不平等。

为了解决这一问题,研究人员提出了使用多重变异效应测定(MAVE, Multiplexed Assays of Variant Effects)的方法。MAVE 能够系统地测试目标基因中所有可能的单核苷酸变异(SNV)或插入/缺失(indel),从而生成饱和式的功能数据。这些数据可以帮助重新分类 VUS,尤其是对于非欧洲血统的个体,减少基因变异分类中的不平等。

论文来源

这篇论文由 Moez Dawood 等人撰写,发表于 Genome Medicine 期刊(2024 年,第 16 卷,第 143 期)。作者来自多个研究机构,包括 Baylor College of MedicineUniversity of WashingtonSt Vincent’s Institute of Medical Research 等。论文通过开放获取的方式发布,遵循 Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License 许可协议。

研究流程

1. 数据来源与样本

研究分析了来自 All of UsGenome Aggregation Database (gnomAD) 的基因组数据,共涉及 420,638 名个体,其中 213,663 名具有欧洲血统,206,975 名具有非欧洲血统。研究将这些个体分为欧洲血统和非欧洲血统两大群体,并比较了他们在多个医学专科中的基因变异分类差异。

2. 变异分类分析

研究使用两种统计方法来评估变异分类的差异: - Wilcoxon 符号秩检验:用于比较不同血统群体中每个基因的等位基因频率差异。 - 卡方检验:用于比较不同血统群体中独有的变异数量。

3. MAVE 数据的整合

研究将经过临床校准的 MAVE 数据整合到 Clinical Genome Resource (ClinGen) 的变异分类专家小组规则中,自动化地对 BRCA1TP53PTEN 基因中的 VUS 进行重新分类。

4. 变异重新分类与功能代码分析

研究开发了一个自动化管道,用于重新分类 VUS。通过移除每个证据代码,研究评估了哪些代码对重新分类至关重要,并比较了不同血统群体中这些代码的影响。

主要结果

1. VUS 在非欧洲血统个体中的高发率

研究发现,非欧洲血统个体在所有医学专科中 VUS 的患病率显著高于欧洲血统个体(p ≤ 5.95e-06)。此外,非欧洲血统个体中“良性或可能良性”(B/LB)变异和“无临床分类”(ND)变异的比例也显著增加(p ≤ 2.5e-05),而欧洲血统个体中“致病性或可能致病性”(P/LP)变异的比例更高(p ≤ 2.5e-05)。

2. MAVE 数据显著减少了 VUS 差异

通过整合 MAVE 数据,研究成功重新分类了非欧洲血统个体中的 VUS,重新分类率显著高于欧洲血统个体(p = 9.1e-03)。这表明 MAVE 数据能够有效补偿 VUS 差异。

3. 计算预测和等位基因频率证据代码的不平等影响

研究发现,MAVE 证据代码对非欧洲血统和欧洲血统个体的影响是平等的,但计算预测代码(p = 6.92e-05)和等位基因频率代码(p = 7.47e-06)对非欧洲血统个体的影响不平等。这表明现有的计算预测工具可能对非欧洲血统个体的变异分类存在偏见。

结论

研究结果表明,生成饱和式的 MAVE 数据应成为减少 VUS 差异的优先事项,并为未来的计算预测工具提供公平的训练数据。通过 MAVE 数据,研究成功减少了非欧洲血统个体中的 VUS 差异,并为基因组医学的公平性提供了新的解决方案。

研究亮点

  1. 重要发现:非欧洲血统个体在基因检测中更可能被归类为 VUS,而欧洲血统个体更可能被归类为 P/LP。MAVE 数据能够显著减少这种差异。
  2. 方法创新:研究首次将 MAVE 数据整合到 ClinGen 的变异分类规则中,自动化地重新分类 VUS。
  3. 应用价值:研究为基因组医学中的公平性提供了新的解决方案,尤其是对于非欧洲血统的个体。

研究意义

这项研究不仅揭示了基因组医学中存在的健康不平等问题,还提出了通过 MAVE 数据减少 VUS 差异的具体方法。通过生成饱和式的功能数据,研究为未来的基因组医学研究提供了新的方向,尤其是在多样性和公平性方面。此外,研究还强调了现有计算预测工具的局限性,呼吁开发更加公平的预测模型。

其他有价值的信息

研究还指出,未来的研究应进一步探讨不同变异类型(如错义变异、同义变异等)对 VUS 差异的贡献,并评估功能获得(Gain of Function)和功能丧失(Loss of Function)变异在分类中的差异。此外,研究呼吁扩大 MAVE 数据的应用范围,以推动基因组医学的公平性革命。