次世代シークエンシングに基づく乳がんポリジェニックリスクスコアローカスの遺伝子型決定の限界

次世代シーケンシングに基づく乳がん多遺伝子リスクスコア位置の遺伝子型決定の限界

背景紹介

遺伝性乳がん(Breast Cancer, BC)の予測において、多遺伝子リスクスコア(Polygenic Risk Scores, PRSs)が個人のリスク予測の重要なツールとして、ますます広く適用されています。PRSの計算は、変異対立遺伝子頻度(Allele Frequencies, AFs)を正確に再現し、それによってPRSSの値を正確に予測することに依存しています。しかし、現在、次世代シーケンシング技術(Next-Generation Sequencing, NGS)を使用して多遺伝子リスクスコアの遺伝子型分析を行う際、多くの技術的制限が存在します。本研究の背景は、これらの技術的課題にあり、乳がんリスク評価モデルの改善と最適化に重要な意味を持ちます。

研究出典および著者背景

本研究はドイツ遺伝性乳がん・卵巢がん連合(German Consortium for Hereditary Breast and Ovarian Cancer, GC-HBOC)のバイオインフォマティクス作業グループによって実施されました。著者チームにはドイツの各大学および研究機関からの多くの科学者が含まれており、具体的な機関には、Carl Gustav Carus大学病院、Dresden工科大学、Münster大学病院、Regensburg大学病院、Cologne大学病院、Hannover医科大学、Tübingen大学病院などがあります。この研究は2024年の「European Journal of Human Genetics」(欧州人類遺伝学ジャーナル)に掲載されました。

研究プロセスの詳細

研究プロセス

研究は主に3つの段階に分かれています: 1. 被験者の遺伝子変異の分析:まず、研究ではPRS変異のgnomAD V3.1.2データベースのヨーロッパサンプルにおけるAFsを分析し、これらの変異がhg38参照ゲノムに変換できるかどうかを確認しました。一部の変異位置が一致しないか欠落していることが検出されました。 2. 実世界データセットの検証:研究に参加した5つのGC-HBOC中心が実世界データセットにおけるPRS変異のAFsを提供し、canriskが予想するAFsと比較したところ、最大24の変異が明らかな偏りを示しました。 3. 臨床診断における実行可能な作業計画:研究では、代理対立遺伝子や代替変異位置の使用など、臨床診断における遺伝子型決定性能を向上させる可能な解決策を提案しました。

実験詳細

  • サンプル源:GC-HBOCセンターの5つの参加ユニット。これには、Institute of Medical Genetics and Applied Genomics(Tübingen大学病院)、Institute for Clinical Genetics(Carl Gustav Carus大学病院)、Department of Medical Genetics(Münster大学病院)、Center for Familial Breast and Ovarian Cancer(Cologne大学病院)、Institute of Human Genetics(Regensburg大学病院)が含まれ、339例から1410例の範囲のサンプルを提供しました。
  • 分析ツール:Dragen、Freebayes、GATKなど複数の変異検出ツールを採用し、同時に異なる呼び出しモード(強制/非強制)を設定しました。遺伝子型データは主にWGSと特定のカスタムがんパネルによって生成されました。

データ分析方法

  • 変異アノテーション:文中ではdbsnpに対応する変異識別子とgnomADの変異アノテーションを使用しました。
  • 予想AFの評価と変換:研究では、canrisk知識ベースのPRS変異の予想AFとgnomAD V3.1.2の非フィンランドヨーロッパ(NFE)サンプルのAFを比較しました。一致しないか偏りが大きいAFsについて詳細に記録しました。
  • 閾値を超えるAFの決定:絶対差を降順に並べ、「エルボー法」を適用して近接点距離の閾値を決定し、有意な偏りのあるAFsを選別しました。

主な結果

データ生成と分析

  • AF偏り:研究では、調査された332のPRS変異のうち、24がgnomAD v3.1.2サンプルにおいてcanriskの予想AFsと有意な偏りを示しました。これらの偏りの多くは、変異位置が低複雑度領域にあることや、変異品質スコア再較正(VQSR)フィルタリング基準を満たさないなどの技術的アーティファクトに関連していました。
  • 実世界データの変異検出:研究では、各参加ユニットが提供したデータにおいて、少なくとも11から23の位置で明らかなAF偏りが示されました。これらの偏りはシーケンシング技術だけでなく、使用された変異検出ツールと呼び出しモードにも依存していました。

乳がんリスク予測への影響

異なる状況(年齢、リスク因子など)での10年および生涯リスク評価をシミュレーションすることで、研究は有意な偏りAFの変異位置が乳がんリスク予測に1%から2%の微小な偏りをもたらすことを示しました。これらの偏りは実際の応用では重要ではありませんが、新しいPRS設計の精度を議論する際に重要な参考となります。

改善案

代替変異位置の適用と代理対立遺伝子の考慮により、研究は一部の変異位置のAF検出精度を向上させることができることを示しました。例えば、rs73754909とrs79461387という2つのエラーが頻繁に報告される位置について、代替対立遺伝子は予想AFとより高い一致度を示しました。

まとめと展望

本研究は、NGSにおけるPRS遺伝子型分析の技術的制限を系統的に評価することで、既存の方法の不足と改善案を示しました。特に新しい乳がんリスク予測において、変異対立遺伝子頻度を正確に再現することはPRS設計の最適化に不可欠です。この研究は乳がん診断において顕著な価値があるだけでなく、他の遺伝子関連疾患のリスクスコアにも技術的指針を提供しています。

研究の意義

NGS技術が臨床遺伝子検査で広く適用されるにつれ、検出精度と再現性の向上が重要になってきています。本研究はいくつかの技術的課題を明らかにし、改善の方向性を提供しました。これは個人のリスク予測に役立つだけでなく、将来の新しいPRSの設計と応用にも重要な指針となります。