基于下一代测序的乳腺癌聚合风险评分位点基因分型局限性

基于下一代测序的乳腺癌聚合风险评分位点基因分型局限性

背景介绍

在遗传性乳腺癌(Breast Cancer, BC)的预测中,多基因风险评分(Polygenic Risk Scores, PRSs)正在日益广泛地应用,作为个体风险预测的一个重要工具。PRS的计算依赖于精确再现变异等位基因频率(Allele Frequencies, AFs),从而准确地预测PRSS的值。然而,目前使用下一代测序技术(Next-Generation Sequencing, NGS)进行多基因风险评分基因型分析时,存在不少技术上的限制。本研究的背景在于这些技术挑战,对改进和优化乳腺癌风险评估模型具有重要意义。

研究来源及作者背景

本研究由来自德国遗传性乳腺癌和卵巢癌联盟(German Consortium for Hereditary Breast and Ovarian Cancer, GC-HBOC)的生物信息学工作组所进行。作者团队包括多位来自德国各大学和研究机构的科学家,具体机构有:Carl Gustav Carus大学医院、Dresden技术大学、Münster大学医院、Regensburg大学医院、Cologne大学医院、Hannover医学院和Tübingen大学医院等。该研究发表于2024年《European Journal of Human Genetics》(欧洲人类遗传学杂志)上。

研究流程详述

研究流程

研究分为三个主要阶段: 1. 受试者基因变异的分析:首先,研究分析了PRS变异在gnomAD V3.1.2数据库欧洲样本中的AFs,并核对这些变异是否能转换到hg38参考基因组。检测到了部分变异位置无法匹配或缺失。 2. 真实世界数据集的检验:参与研究的五个GC-HBOC中心提供了真实世界数据集中PRS变异的AFs,与canrisk预期的AFs进行比对,发现多达24个变异显示了明显的偏差。 3. 在临床诊断中的可行工作方案:研究提出了在临床诊断中提高基因分型性能的可能解决方案,如使用代理等位基因和替代变异位点。

实验细节

  • 样本来源:GC-HBOC中心的五个参与单位,包括Institute of Medical Genetics and Applied Genomics(Tübingen大学医院),Institute for Clinical Genetics(Carl Gustav Carus大学医院),Department of Medical Genetics(Münster大学医院),Center for Familial Breast and Ovarian Cancer(Cologne大学医院)和Institute of Human Genetics(Regensburg大学医院),共提供了339例到1410例不等的样本。
  • 分析工具:采用了多个变异检测工具,包括Dragen、Freebayes和GATK等,同时设置了不同的调用模式(强制/非强制)。基因型数据主要通过WGS和特定定制癌症面板生成。

数据分析方法

  • 变异注释:文中使用了与dbsnp对应的变异标识符和gnomAD中的变异注释。
  • 预期AF的评估和转换:研究对比了canrisk知识库中PRS变异的预期AF与gnomAD V3.1.2中的非芬兰欧洲(NFE)样本的AF。对无法匹配或偏差较大的AFs进行了详细记录。
  • 超出阈值的AF的确定:通过降序排列绝对差值,并应用“弯曲点法”确定接近点距的阈值,筛选显著偏差的AFs。

主要结果

数据生成和分析

  • AF偏差:研究发现,在332个被研究的PRS变异中,有24个在gnomAD v3.1.2样本中的AFs与canrisk预期的AFs出现了显著偏差。这些偏差多与技术性伪影相关,如变异位点处于低复杂度区域或未达到变异质量分数重新校准(VQSR)滤过标准。
  • 真实世界数据的变异检测:在研究中,每个参与单位提供的数据显示,至少有11个到23个位点显示了明显的AF偏差,这些偏差不仅依赖于测序技术,还与所使用的变异检测工具和调用模式相关。

对乳腺癌风险预测的影响

通过模拟不同情况下(包括年龄、风险因子等)的10年和终生风险评估,研究表明,显著偏差AF的变异位点会导致乳腺癌风险预测的1%到2%的微小偏差。这些偏差虽然在实际应用中不是关键的,但在探讨新PRS设计的准确性时具有重要参考意义。

改进方案

通过应用替代变异位点和考虑代理等位基因,研究表明可以提高部分变异位点的AF检测准确性。例如,针对rs73754909和rs79461387这两个报错频繁的位点,替代等位基因与预期AF的吻合度更高。

总结与展望

本研究通过系统评估NGS在PRS基因型分析中的技术限制,展示了现有方法的不足和改进方案。特别是在新的乳腺癌风险预测中,准确再现变异等位基因频率对优化PRS设计至关重要。这项研究不仅在乳腺癌诊断中具有显著价值,也对其它基因相关疾病的风险评分提供了技术指导方向。

研究意义

随着NGS技术在临床基因检测中的广泛应用,如何提高检测准确性和再现性成为关键。本研究揭示了一些技术挑战,并提供了改进的方向,这不仅对个人风险预测有帮助,对未来新PRS的设计和应用都有重要指导意义。