シンテニー分析を用いた複雑な微生物群の株追跡により種ごとの進化モードが明らかに

複雑な微生物群集における遺伝子配列分析を用いた菌株追跡による種特異的進化パターンの解明

背景紹介

微生物の集団は、単一ヌクレオチドの変異と構造変化(組換え、挿入、欠失など)を通じて異なる菌株に分化します。大多数の菌株比較方法は主に単一ヌクレオチド多型(SNP)の差異を量化し、構造変化を無視しています。しかし、組換えは多くの種(ヒト病原体を含む)の表現型の多様化の重要な推進要因です。本稿では、SynTrackerと呼ばれるツールを紹介します。このツールは遺伝子配列(ゲノム内の相同領域のシーケンスブロックの順序)を使用して微生物菌株を比較します。遺伝子配列は既存の菌株比較ツールによって十分に活用されていない豊富なゲノム情報源です。SynTrackerはSNP感度が低く、データベースを必要とせず、シーケンスエラーに対して堅牢です。これはメタゲノムデータの菌株追跡において既存のツールよりも優れており、特にファージ、プラスミド、およびデータが限られている状況に適しています。単一種のデータセットおよびヒト腸内メタゲノムに適用することで、SynTrackerはSNPベースのツールと組み合わせて、点突然変異または構造変化によって豊富な菌株を検出し、微生物の原位進化についての洞察を提供します。

論文の出典

本論文はHagay Enav、Inbal Paz、Ruth E. Leyによって執筆され、著者はMax Planck Institute for Biology(テュービンゲン、ドイツ)およびUniversity of Tübingen(テュービンゲン、ドイツ)に所属しています。この研究は著名な雑誌《Nature Biotechnology》に掲載され、論文番号はhttps://doi.org/10.1038/s41587-024-02276-2です。

研究の詳細な過程

プロセス概要

  1. 相同領域の識別

    • 参照ゲノムを選択し、1-kbpの中心領域に分割します。
    • サンプル特異的メタゲノムアセンブリライブラリをBLASTデータベースに変換し、高厳密度のBLAST検索を使用してこれらの中心領域をクエリとして使用し、最低同一性比率を97%、最小クエリカバレッジを70%に設定します。
    • 各BLASTヒットに対して、ターゲットシーケンスおよびその上下流2-kbpの領域を検索し、これらの領域を特定の領域のボックスに収集します。
  2. 領域特異的配列スコアの計算

    • 各特定領域の相同集合を一意の領域ボックスに割り当てます。
    • 各ボックス内で、ペアごとの比較を実行して配列ブロックを識別し、識別された配列ブロックの数と2つのシーケンス間の重複に基づいて領域特異的なペアごとの配列スコアを計算します。
  3. 総合スコア(APSS)の計算

    • 各ペアのメタゲノムサンプル(またはゲノム)に対して、ランダムにn個の領域を抽出して比較し、これらの領域のペアごとの配列スコアの平均を取ることでAPSSを取得します。

主要な実験と結果

  1. 性能テストと感度

    • BacMetaソフトウェアを使用して体内シミュレーションを行い、SNPのみおよび挿入/欠失のみの2種類の変異を導入して、2種類のシミュレーションの配列スコアを比較します。
    • SNPシミュレーションでは、領域の最低平均BLAST同一性は99.5%、挿入/欠失シミュレーションでは最低99.79%に達します。
    • 結果は、挿入/欠失を導入した集団では、遺伝子領域の配列スコアがSNP集団よりも顕著に低いことを示しています。
  2. 菌株分類

    • 14の分類済みのEscherichia coliゲノムを使用し、ランダムに140のゲノムを選択して分析し、系統樹を構築します。
    • 結果は、SynTrackerがわずか2%のゲノムサンプルを使用して出版された系統分岐を再現できることを示しています。
  3. 菌株追跡の閾値設定

    • ヒト腸内微生物群の縦断研究に基づき、菌株ペアの分類精度が最も高いAPSS値を計算し、これを基準にして異なる種の位置パターンをさらに分析します。
    • 乳児期における母子菌株の共有率が高く、乳児の年齢が増加するにつれて菌株共有の総数は増加しますが、割合は相対的に減少することが観察されました。
  4. 遺伝子構造変異に対する高感度

    • SNP追跡ツールと組み合わせて、Neisseria gonorrhoeae、耐性Escherichia coli、Helicobacter pylori、およびStreptomyces rimosusのサンプルを分析します。
    • 結果は、SynTrackerが構造変異に対して高感度である一方、SNPツールは点突然変異に対してより敏感であることを示しています。

主要な結論と研究の意義

  • 科学的および応用価値:SynTrackerは微生物の原位進化分析において独自の利点を示し、遺伝子配列とSNP分析を組み合わせることで、菌株の分化における種の異なるパターンを明らかにします。これは基礎科学レベルで重要な意義を持つだけでなく、病原体追跡や抗薬性研究などの応用研究にも新しいツールと方法を提供します。

  • 研究のハイライト

    • 新規性:初めて遺伝子配列法を導入し、既存のゲノム分析ツールの比較フレームワークを拡張しました。
    • 高効率および正確性:非常に少量のゲノム断片を使用して、高効率な菌株分類および追跡が可能です。
    • 広範な適用性:データが限られている状況、例えばプラスミド、ファージ、希少種の菌株追跡に適しています。

その他の価値ある情報

  • オープンソースおよび方法共有:SynTrackerはオープンソースソフトウェアとしてGitHubプラットフォームで無料提供されており、他の研究者が利用および改良するのに便利です。
  • 将来の展望:SNPおよび遺伝子配列分析ツールを組み合わせることで、特定の種の進化の分子機構を深く研究し、環境および進化圧が微生物ゲノムの多様性に与える影響をさらに明らかにすることができます。

この研究は微生物集団の進化メカニズムの理解を広げるだけでなく、実際の応用にも大きなサポートを提供します。研究者はこれらのツールを活用して、微生物群の複雑性および動的変化をより正確に追跡および研究することができます。