自己教師あり深層学習を用いたクライオ電子顕微鏡における優先配向問題の克服

単粒子冷凍電子顕微鏡における優先配向問題の克服:深層学習による革新的解決法

背景紹介

近年、単粒子冷凍電子顕微鏡(Single-Particle Cryo-EM)技術は、生体高分子を天然状態に近い条件下で原子分解能で解析できることから、構造生物学のコア技術として確立されました。しかし、実際の応用では、「優先配向」(Preferred Orientation)という技術的な壁に直面することが多いです。この問題の主な原因は、生体分子が冷凍電子顕微鏡のグリッド上で均等に分布せず、特定の方向のデータ収集が不十分になることです。この配向偏差は通常、試料調製プロセス中に分子が空気-水界面(Air-Water Interface, AWI)またはサポート膜-水界面との相互作用によって引き起こされます。

優先配向問題は、特に三次元再構成で顕著です。この問題が生じると、各向異性(Anisotropy)が原因で三次元構造が損傷を受けたり、歪んだりします。それによって現れる現象としては、二次構造の偏り、ペプチド鎖の断裂、密度の不連続などが挙げられます。これにより、分子モデルの構築や精度が影響を受けることになります。この問題は、特に低対称性や非対称性の分子に対して深刻な影響を及ぼします。過去の研究では、この優先配向問題を解決するために、試料調製方法の調整、異なるサポート膜の使用、試薬の添加による分子挙動の変更など、主に生化学や物理学的アプローチが取られてきました。しかし、これらの方法は通常、複雑で時間がかかり、コストも高いだけでなく、新たな干渉(例えば高い背景ノイズや新たな優先配向問題)を引き起こす可能性があります。

この難題を克服するために、カリフォルニア大学ロサンゼルス校(University of California, Los Angeles)のYun-Tao Liu、Hongcheng Fan、Jason J. Hu、そしてZ. Hong Zhouの研究チームは、完全に新しい計算手法を提案しました。彼らは「自己教師あり深層学習」を基盤としたツールSPISONet(Single-Particle IsoNet)を開発し、試料調製プロセスを変更することなく、計算手法で優先配向に関連する各向異性問題を解決することに成功しました。この研究は2025年1月号の《Nature Methods》に掲載されました。


研究フロー

研究目的

SPISONetの開発の主な目的は、優先配向問題がもたらす2つの核心的な問題を解決することにあります:1)再構成プロセスで発生する各向異性;2)各向異性による粒子のミスアラインメント(Misalignment)。研究チームは、深層学習ネットワークとその革新的な自己教師ありフレームワークを採用し、2つの独立かつ補完的なモジュール——各向異性補正モジュール(Anisotropy Correction Module)とミスアラインメント補正モジュール(Misalignment Correction Module)を提案しました。


ワークフローおよび実験設計

1. 各向異性補正モジュール

このモジュールは、2つの未フィルタリングの半マップ(Half-Maps)および溶媒マスク(Solvent Mask)を入力として必要とします。主要なフローは以下の通りです: - 3DFSCの計算:三次元フーリエシェル相関(3DFSC)アルゴリズムを用いて方向分解能の各向異性を正確に評価します。SPISONetには効率的な3DFSC計算方法が統合されており、計算負荷を大幅に削減することで実行時間を短縮しています。 - 深層学習ネットワークの訓練:U-Netアーキテクチャに基づくニューラルネットワークがこのモジュールの技術的支柱となっています。ネットワークの訓練は、データ整合性損失(Consistency Loss)、回転等変性損失(Equivariance Loss)、およびNoise2Noiseフレームワークに基づく2つの損失関数を含む4つの損失関数に依存しています。この損失関数によって、ネットワークは情報復元プロセス中に欠損サンプリング領域を補填しながら、過学習やアーティファクトの発生を防ぎます。 - 情報復元およびノイズ除去:自己教師あり学習を通じて、SPISONetは各向異性領域の画像密度を補正し、さらに局所的なノイズを低減させることで、三次元再構成マップの品質を向上させます。

人工的なシミュレーションおよび実際のデータ評価から、SPISONetの各向異性補正モジュールは、中程度および軽度の優先配向問題に対処する際に顕著な改善をもたらし、極端な条件下でも構造損傷を部分的に抑制することができることが示されました。


2. ミスアラインメント補正モジュール

三次元分子再構成では、優先配向問題が原因で誤った粒子配向の割り当てが発生し、これが再構成アーティファクトの主要因となることがあります。ミスアラインメント補正モジュールは、以下の統合されたプロセスを通じてこれを解決します: - 参照マップの生成:ユーザーが提供した参照マップ(例えば、傾斜したデータや低分解能の初期構造から取得可能)を活用します。 - 自動化反復補正:このモジュールは、RELIONの3D再構成とSPISONetの各向異性補正アルゴリズムを組み合わせ、粒子の配向分布を段階的に最適化します。また、初期参照モデルの偏り(Model Bias)の潜在的リスクを回避するため、低分解能モードの選択も可能です。 - 誤差統一管理:複数の反復的最適化を通じて、配向偏差によるアーティファクトを大幅に軽減します。

標準的な三次元再構成プロセスと比較した場合、SPISONetは顕著な誤差訂正性能を発揮しました。ミスアラインメント補正と各向異性補正を組み合わせた適用後、複数のケースでαヘリックスのピッチやアミノ酸側鎖など、詳細でクリアな二次構造密度が示されました。


データセットと実験証明

1. β-ガラクトシダーゼデータセット実験
研究チームは、RELIONチュートリアル用のCryo-EMデータを使用し、2D分類で得られた異なる配向の粒子を選別しました。この方法で、SPISONetの有効性を確認したところ、側面視および上面視の粒子を使用して再構成された各向異性マップの品質が改善されることが示されました。

2. ヘマグルチニン三量体傾斜データセット
40°傾斜された収集データ(EMPIAR-10097)を使用してテストを行いました。SPISONetにより処理された後、再構成マップの分解能は4.1Åに向上し、元のマップで不可視だった側鎖領域が改善されました。また、ミスアラインメント補正モジュールは画像の各向同性を向上させ、元のデータ内の配向分布偏差の制約を解消しました。

3. 深刻な優先配向を持つヘマグルチニン三量体非傾斜データ
深刻な優先配向の問題があるデータセット(EMPIAR-10096)に対して、SPISONetを利用してミスアラインメント補正と各向異性補正を組み合わせた結果、3.5Åの分解能再構成マップを生成しました。注目すべきことに、この方法は従来の方法では克服が困難だった再構成アーティファクトを成功裏に解決しました。

4. 病原性70Sリボソームデータセット
Acinetobacter baumannii 70Sリボソームデータセットの優先配向を持つ粒子に対応するよう、フィルタ処理を行った結果を報告しています。70Sおよび80Sリボソームを低分解能参照として試行したところ、SPISONetはどちらのケースでも高品質な再構成マップを生成し、その柔軟性と適用性をさらに証明しました。

5. HIVウイルス様粒子(VLP)
HIV VLPのサブトモグラム平均化実験では、SPISONetが生成した3.6Å分解能の構造は、標準処理パイプラインよりもはるかに良好な結果を示し、原位生物構造研究における価値を示しました。


研究結果とまとめ

SPISONetは、深層学習および自己教師ありフレームワークを通じて、優先配向問題を効果的に解決すると同時に、冷凍電子顕微鏡再構成作業向けに効率的で汎用性の高い計算解決法を提供しました。その主な利点は以下の通りです: 1. 計算ワークフロー化:試料調製プロセスを大幅に簡素化することで、人的介入を削減できます。 2. 極端なデータへの優れた対処力:深刻な優先配向データセットにおいても、高品質な構造を得ることができます。 3. 柔軟性および汎用性:さまざまな生体分子の解析に対応し、単粒子Cryo-EMおよびサブトモグラム平均化手法の両方に適用可能です。

この革新的な計算ツールは、複雑な生体試料研究におけるCryo-EMの適用範囲を拡大させたばかりか、高スループットおよび高精度の構造解析への道を切り開きました。