シーケンスベースの機能的メタゲノミクスが環境微生物群における銅耐性遺伝子copaの新しい自然多様性を明らかにする

配列に基づく機能メタゲノミクスが環境マイクロバイオームにおける機能的COPA遺伝子の新しい自然多様性を明らかにした

環境マイクロバイオームにおける機能遺伝子/タンパク質の自然多様性は、進化および生物工学研究の重要な構成要素です。銅(Cu)耐性遺伝子COPAの世界的な微生物における多様性をより深く理解するために、本研究では配列ベースの機能メタゲノミクスアプローチを採用しました。この研究は、メタゲノムアセンブリ技術、ローカルBLAST、進化的トレース分析(ETA)、化学合成、および従来の機能ゲノミクスを組み合わせただけでなく、環境DNA(eDNA)からCOPA遺伝子の多様性を効率的に掘り起こすことに成功しました。

研究背景

微生物の進化過程で多様な機能遺伝子/タンパク質が生み出され、これらの遺伝子/タンパク質は微生物系統学やタンパク質工学などの分野で広く応用されています。例えば、DNAに指示されるRNAポリメラーゼのサブユニットベータ(RPB)や窒素固定酵素鉄タンパク質(NIFH)などの遺伝子は、培養不可能な’暗黒物質’の同定と記述に広く使用されています。既知の機能タンパク質は、自然選択過程で生み出されたタンパク質のごく一部にすぎません。自然の機能タンパク質バリアントの多様性を高スループットで回収することは、既存の天然タンパク質とランダム配列との間のギャップを明らかにし、自然選択に基づく大規模な配列バリアントライブラリのタンパク質工学の基礎を提供します。

しかし、金属耐性遺伝子などの一部の機能遺伝子/タンパク質については、環境中の低い豊富さや一般的なデータベースにおける特徴付けされた配列の不足のため、その自然多様性の探索は依然として困難です。メタゲノムデータは環境DNAの全遺伝情報を含んでおり、これらの遺伝子/タンパク質の自然多様性を探索するための理想的な手段を提供します。従来、機能遺伝子の検出は純粋培養物のゲノムプロービングに依存していました。一方、配列ベースのメタゲノミクスは、機能スクリーニング法と冗長な分離の制限を超えています。

研究ソース

この論文は、Wenjun Li、Likun Wang、Xiaofang Li、Xin Zheng、Michael F. Cohen、Yong-Xin Liuらによって共同で完成されました。これらの研究者は、中国科学院遺伝発生生物学研究所、河北省土壌生態学重点研究室、ソノマ州立大学(米国)、中国科学院植物ゲノミクス国家重点研究室に所属しています。この研究は2023年に「Genomics Proteomics & Bioinformatics」誌に発表されました。

研究プロセス紹介

1. データ収集と処理

公共データベースから87のメタゲノムデータセットを収集しました。これらのデータセットは世界中の様々な環境マイクロバイオームを代表しています。MG-RASTサーバーを使用して、これらのメタゲノムのアセンブリと品質管理を行い、データの完全性と正確性を確保しました。その後、これらのメタゲノムデータをローカルBLASTに入力し、COPA遺伝子配列の検索を行いました。

2. COPA遺伝子の検索と分析

すべてのアセンブルされたメタゲノムに対するBLAST検索を通じて、93,899のヒットレコードを得ました。手動でスクリーニングを行い、1,214の高信頼性ヒットレコードを選び、最終的に517のユニークなCOPA候補配列を検索しました。これらの配列はさらにETA分析を経て、175の高品質な新規COPA配列が選別されました。その後、系統樹分析を用いてこれらの配列と既知のCOPAタンパク質との進化関係を分析しました。

3. 機能検証実験

10個の新規COPA遺伝子を化学合成し、Cu感受性のEscherichia coli(ΔcopA)で異種発現を行いました。成長試験とCu吸収測定により、そのうち5つの新規クローンが宿主のCu耐性と吸収に正の影響を与えることが示されました。そのうちの1つ、COPA-like 15(copal15)は宿主のCu耐性を成功裏に回復させ、Cu吸収能力を大幅に向上させました。さらに、2つの新規COPA遺伝子をGFP遺伝子と融合させ、E. coliで顕微鏡観察を行った結果、それらが正しく発現し、細胞膜に局在することが示されました。

研究結果

ETAとCOPAタンパク質の構造特徴

ETA分析により、既知の34のCOPAタンパク質は主に14種類のバクテリア種に由来することが示されました。ほぼすべての既知COPAタンパク質がCu排出に機能し、E. hiraeのCOPAのみが銅取り込みP型ATPaseとして注釈付けされていました。タンパク質の長さに関しては、COPAは通常約800個のアミノ酸を含み、最長のものはYersinia pestisに由来し、961個のアミノ酸を含んでいました。14グループのCOPAのうち、重金属輸送ATPase(HMA)ドメインの数は1から3まで様々でしたが、Legionella pneumophila属のCOPAにはHMAドメインが存在しませんでした。すべてのCOPAタンパク質はE1-E2 ATPaseドメインを持っており、これはATP加水分解と構造変化によるCu結合と排出に関与する構造です。

グローバルマイクロバイオームにおける新規で多様なCOPA遺伝子

88のメタゲノムデータセットから、550万以上のcontigsと1.34億のアミノ酸配列をローカルBLASTに使用し、最終的に87のデータベースで分析を行いました。合計93,899のヒットデータが得られ、手動スクリーニングにより517の配列が選別されました。これらの配列の長さは500から900アミノ酸の範囲で、そのうち315の配列が膜貫通ヘリックスを持ち、222の配列が重金属輸送ATPaseドメインを含んでおり、最終的に175のCOPA様遺伝子が選別されました。Kraken 2による分類では、これらの遺伝子は主に5つの門に分布していました:プロテオバクテリア門、アクチノバクテリア門、ユーリアーキオータ門、バクテロイデス門、ファーミキューテス門で、そのうち55の配列は完全に未知の種でした。

機能検証

175のCOPA候補遺伝子からランダムに10個を選び、化学合成し、E. coli ΔcopAで発現させました。成長試験とCu吸収試験により、そのうち5つの新規COPA遺伝子が宿主のCu耐性と吸収能力を大幅に向上させることが示されました。特にCOPA-like 6は宿主の成長を著しく抑制しましたが、そのCu吸収能力も同様に著しく向上しました。

研究結論

本研究は既知のCOPAタンパク質の多様性を大幅に拡大し、配列ベースの高スループット機能メタゲノミクス法を開発しました。これは従来の方法における長さ、スクリーニング、耐性遺伝子の豊富さのバイアスの問題を克服しています。研究はCOPA遺伝子の新種における多様性とその異なる耐性メカニズムを示しており、これは今後のタンパク質工学と金属耐性遺伝子の進化研究のための貴重な基礎リソースを提供しています。

研究のハイライト

  1. 効率的なデータ処理方法:世界規模で環境マイクロバイオームの機能遺伝子を掘り起こし、分析するための効率的な配列ベースの機能メタゲノミクス法を開発・適用しました。
  2. 多様性の解明:環境マイクロバイオームにおけるCOPA遺伝子の広範な多様性を明らかにし、多くの未知種からの新しいCOPA配列を発見しました。
  3. 機能検証:異種発現を通じて新たに発見されたCOPA遺伝子の機能を検証し、新しいCOPA遺伝子の銅耐性と吸収の向上における潜在能力を示しました。

価値と意義

この研究は、微生物の金属耐性の自然多様性の理解に重要な科学的価値があるだけでなく、将来の環境修復と生物工学応用のための新しい遺伝子リソースと方法を提供しています。同時に、この研究の方法はメタゲノムデータの機能的マイニングのための実行可能性が高く効率的な技術的アプローチを提供し、幅広い応用の見通しを持っています。