SCICONE:単細胞コピー数変異とイベント履歴の再構築

腫瘍の進化過程において、ゲノムコピー数変異(Copy Number Alterations, CNAs)は腫瘍の異質性と進化を駆動する重要な要因です。これらの変異を理解することは、個別化されたがん診断や治療法の開発にとって極めて重要です。単一細胞シーケンス技術は、単一細胞レベルまで深く分析できる最高解像度のコピー数解析を提供します。しかし、低リード深度(low read-depth)の全ゲノムシーケンスデータは、コピー数変異の検出に大きな統計的および計算上の課題をもたらします。既存の計算方法の多くは細胞間の進化的関係を無視しており、その結果、検出精度が低下しています。そのため、細胞の進化歴史を組み込んだコピー数検出方法の開発が現在の研究における緊急の課題となっています。

論文の出典

本論文はETH Zurich(スイス連邦工科大学)とSIB Swiss Institute of Bioinformatics(スイスバイオインフォマティクス研究所)の研究チームによって共同で行われ、主な著者にはJack Kuipers、Mustafa Anıl Tuncel、Pedro F. Ferreira、Katharina Jahn、Niko Beerenwinkelが含まれます。論文は2025年に『Bioinformatics』誌に掲載され、タイトルは「Single-cell copy number calling and event history reconstruction」です。

研究の流れ

1. 研究目的と方法の概要

本研究の核心的な目的は、SCICONEと呼ばれる統計モデルとマルコフ連鎖モンテカルロ(MCMC)アルゴリズムを開発し、低リード深度の単一細胞全ゲノムシーケンスデータからコピー数変異イベントの歴史を再構築し、個々の細胞のコピー数プロファイルを推定することです。SCICONEは細胞の進化的関係を統合することで、コピー数検出の精度を向上させます。

2. データの前処理とセグメンテーション

研究ではまず、単一細胞シーケンスデータの前処理を行い、GC含量やマッピングバイアスの補正を行いました。その後、動的計画法を用いてゲノム中のブレークポイント(breakpoints)を検出し、ゲノムを複数のコピー数が同じセグメントに分割しました。このステップの鍵は、複数の細胞の信号を組み合わせて、有意なコピー数変化領域を識別することです。

3. コピー数イベントツリーの構築

SCICONEはコピー数イベントツリー(CNA tree)を構築することで、腫瘍の進化歴史をモデル化します。イベントツリーのノードはコピー数イベント(例:増幅や欠失)を表し、ツリーのトポロジーはこれらのイベントの順序と関係を反映します。研究ではMCMCアルゴリズムを用いてイベントツリーをサンプリングし、最も可能性の高いツリー構造とイベントの組み合わせを見つけます。

4. コピー数プロファイルの推定

イベントツリーを基に、SCICONEは各細胞のコピー数プロファイルを推定します。細胞をイベントツリーのノードに割り当てることで、経路上のコピー数イベントに基づいて各細胞のコピー数状態を推定します。このプロセスはコピー数検出の精度を向上させるだけでなく、腫瘍のクローン構造を明らかにします。

5. シミュレーションと実データでの検証

研究ではシミュレーションデータと実際の腫瘍サンプルを用いてSCICONEの性能を検証しました。シミュレーションデータは異なるリード深度とセグメント数をカバーしており、SCICONEは低リード深度と高ノイズ条件下で優れた性能を示しました。実際のデータでは、SCICONEは三重陰性乳がんサンプルのコピー数進化歴史を再構築し、重要なドライバー遺伝子変異を検出しました。

主な結果

1. シミュレーションデータでの検証

シミュレーションデータにおいて、SCICONEは低リード深度(2x-8x)および高ノイズ条件下で優れた性能を発揮し、コピー数検出の精度が他の方法(HMMCopy、Ginkgo、Scopeなど)を大幅に上回りました。特に小さなセグメントのコピー数イベントを処理する際に、SCICONEの優位性がより顕著でした。

2. 実データへの適用

三重陰性乳がんサンプルでは、SCICONEが腫瘍のクローン構造を再構築し、TP53、PIK3CA、AKT1などの重要な遺伝子のコピー数変異を検出しました。さらに、研究では全ゲノム複製イベントを発見し、これが腫瘍進化において重要な意味を持つことが示されました。

3. アルゴリズム性能の比較

既存のコピー数検出方法と比較して、SCICONEは精度と堅牢性の両方で大幅な向上を示しました。特に低リード深度データを処理する際に、SCICONEは信号とノイズをより効果的に分離し、信頼性の高いコピー数プロファイルを提供しました。

結論と意義

SCICONEは細胞の進化的関係を統合することで、単一細胞コピー数検出の新しい方法を提供します。その核心的な利点は、コピー数プロファイルと進化歴史を同時に推定できることにあり、腫瘍のクローン構造と進化動態をより正確に明らかにします。この方法は科学的重要さを持つだけでなく、個別化がん治療に新たなツールを提供します。

研究のハイライト

  1. 進化歴史の統合:SCICONEは初めてコピー数検出と細胞の進化歴史を組み合わせ、検出精度を大幅に向上させました。
  2. 動的計画法によるブレークポイント検出:研究では動的計画法に基づくブレークポイント検出方法を開発し、コピー数変化領域を効果的に識別しました。
  3. MCMCアルゴリズムの最適化:MCMCアルゴリズムを用いることで、SCICONEは複雑なツリー構造空間で効率的に探索を行い、最も可能性の高い進化モデルを見つけます。
  4. 幅広い応用可能性:SCICONEは低リード深度の単一細胞シーケンスデータだけでなく、ターゲットシーケンスやマルチオミクスデータ解析にも適用可能であり、広範な応用が期待されます。

その他の価値ある情報

研究チームはSCICONEのオープンソース実装を提供しており、コードはGitHubで入手可能です(https://github.com/cbg-ethz/scicone)。さらに、研究では詳細なSnakemakeワークフローも提供されており、他の研究者が実験結果を再現するのに役立ちます。

本研究の革新的な手法を通じて、腫瘍進化分析、がん診断、治療戦略の最適化などの分野でさらなる進展が期待されます。