がんと無細胞DNAにおける全ゲノムリピート景観
癌症和游离DNA中的全基因组重复序列全景
研究背景和意义
癌症及び他の病気の発展過程において、ゲノム内の繰り返し配列の遺伝的変化は重要な特徴の一つです。しかし、標準的なシーケンシング方法ではこれらの繰り返し配列を効果的に特徴づけることが難しいのです。この課題に対応するため、本研究ではArtemis(Analysis of Repeat Elements in Disease)と呼ばれる新しい方法を開発し、全ゲノムシーケンシング中の繰り返し要素を識別します。複数の癌患者の組織および血漿サンプルを分析することで、これらの繰り返し要素の具体的な変化を探索し、早期癌検出および病気のモニタリングにおける潜在的な応用価値を評価することを目的としています。
論文出典
本研究は、Akshaya V. Annapragada、Noushin Niknafs、James R. Whiteらが共同で行ったもので、彼らはジョンズ・ホプキンス大学医学部Sidney Kimmel総合癌センターおよび医学系に所属しています。この成果は2024年3月13日に《Science Translational Medicine》誌に発表され、記事番号はeadj9283です。
研究プロセス
全体的なプロセスの概要
本研究に含まれる全体的なプロセスは、Artemis方法の開発、データ収集と処理、繰り返し要素の識別、機械学習モデリング、結果の検証および臨床応用評価を含みます。研究対象には1975名の患者の2837個の組織および血漿サンプルが含まれており、肺癌、乳癌、結直腸癌など様々な癌のタイプが含まれています。
データ収集と処理
研究はまず、T2T参照ゲノム(chm13)に基づく新しいkmer探索方法を使用し、kmer(短配列)のデノボ識別を行いました。これにより合計12億個の24-bp kmerが見つかりました。これらのkmerは、長散在核内の要素(LINEs)、短散在核内の要素(SINEs)、長末端反復配列(LTRs)、トランスポゾン要素およびヒトサテライトファミリーを含む1280種類の繰り返し要素タイプを定義するために使用されました。
繰り返し要素の識別と分析
Artemis方法を使用して、異なる癌タイプにおけるこれらの繰り返し要素の特定の変化を分析した結果、820種類の要素が癌において初めて変化を示すことが発見されました。さらに、繰り返し要素はドライバー遺伝子領域に富むことが分かり、これらの変化はゲノム構造変化およびエピジェネティック状態と関連があることが示されました。
機械学習モデルの構築
全ゲノム繰り返し風景および無細胞DNA(cfDNA)の断片化プロファイルを機械学習で分析することで、早期肺癌および肝癌を検出する予測モデルを開発しました。このモデルは交差検証および外部検証のコホートで高い精度を示し、非侵襲的に腫瘍の出所組織を識別することができました。
結果の検証と臨床応用評価
研究結果は、繰り返し風景の変化が癌ゲノムに広く存在し、これらの変化をcfDNAを通じて検出し、癌の早期検出と病気のモニタリングに利用できることを示しました。具体的には、機械学習モデルのArtemisスコアは癌と正常組織を区別でき、患者の全生存率および無進行生存率と密接に関連していました。
研究結果
ゲノム範囲の繰り返し要素の初期発見
デノボ識別により、本研究は12億個の特定のkmerを発見し、これらのkmerが1280種類の繰り返し要素タイプを表し、全ゲノムの全ての染色体に存在することを確認しました。さらにこれらの繰り返し風景の分析により、820種類の要素が初めて癌において変化を示すことが発見されました。
繰り返し要素のゲノム分布と癌関連性
繰り返し要素が癌遺伝子に富むことは、これらの要素が癌の発生・発展過程で重要な役割を果たす可能性があり、例えば遺伝子の増幅、削除、および再編において特定の構造変化の機能を持つことを示しています。また、特定の癌タイプにおいて、繰り返し要素の構造断裂点における富みは、これらの要素がこれらの構造変化を促進する潜在的な役割があることをさらに証明しています。
cfDNAにおける繰り返し配列風景の検出
研究は、低カバレッジ全ゲノムシーケンシングにおいても、cfDNAにおける繰り返し配列風景の変化を信頼性高く検出できることを示しました。異なる癌タイプにおいて、cfDNA内の多くの繰り返し要素が腫瘍組織と一致する特定の変化を示すことが発見されました。さらに、エピジェネティック状態(例えばヒストン標識)の変化もこれらの要素がcfDNAにおいて提示されることに影響を与えました。
機械学習モデルの性能評価
機械学習モデルのArtemisスコアを通じて、癌患者のcfDNAを分析する際に、癌状態と正常状態を有効に区別することができました。また、モデルのスコアは患者の全生存率および無進行生存率と顕著な関連があり、特に進行癌患者においては、高いArtemisスコアが悪い予後と関連していました。
臨床応用の可能性
研究は、Artemisスコアと他のcfDNA断片化特徴を統合したモデルを通じて、癌患者の早期検出、モニタリングおよび腫瘍の出所組織を推定することが可能であることを示しています。特に肺癌および肝癌の検出において、この統合モデルは高い精度と信頼性を示し、将来の臨床応用において、癌の早期スクリーニングおよび個別化治療の新しいツールを提供することが期待されます。
結論
本研究はArtemis方法を開発することで、繰り返し要素に基づく新しい全ゲノム分析方法を提供し、癌における広範な変化を検出および特徴づけることができました。これらの結果は、癌ゲノムにおける繰り返し配列の広範な変化を明らかにし、早期癌検出および病気のモニタリングに新しい方法を提供します。将来、この方法をさらに最適化および検証することで、癌の早期診断および治療において重要な役割を果たすことが期待されます。
研究の重要性
本研究は科学界に対し、癌ゲノムにおける繰り返し配列変化に関する重要な見解を提供し、これらの変化が癌の発展において潜在的な役割を果たすことを明らかにしました。また、研究が提案するArtemis方法は、cfDNAに基づく非侵襲的な癌検出に新しい戦略を提供し、早期発見および正確な治療に寄与します。さらに、複数の癌タイプの分析を通じて、異なる腫瘍のゲノムレベルでの共通の特徴および相違点をさらに探るための重要なデータを提供します。