AFMと深層ニューラルネットワークを用いたRNAコンホーマー構造の決定
学術的背景
RNA(リボ核酸)は生命体において極めて重要な分子であり、遺伝子発現、調節、触媒など多様な生物学的プロセスに関与しています。ヒトゲノムの大部分はRNAに転写されますが、RNA分子の構造研究は依然として大きな課題を抱えています。RNA分子は通常、高い構造的多様性と柔軟性を持ち、これがその機能の前提となっていますが、これが核磁気共鳴(NMR)、X線結晶学、クライオ電子顕微鏡(cryo-EM)などの伝統的な構造解析手法の適用を制限しています。特に大きなRNA分子では、その構造的多様性と大規模なRNA構造データベースの欠如により、既存のタンパク質構造予測手法(例:AlphaFold)を直接RNAに適用することができません。したがって、大きなRNA分子の三次元構造、特にその構造的多様性を正確に解析することは、RNA構造生物学における重要な課題となっています。
論文の出典
この論文は、Maximilia F. S. Degenhardt、Hermann F. Degenhardt、Yuba R. Bhandariら、米国国立がん研究所(National Cancer Institute)、米国国立糖尿病・消化器・腎臓病研究所(National Institute of Diabetes and Digestive and Kidney Diseases)など複数の研究機関の科学者たちによって共同執筆されました。論文は2024年にNature誌に掲載され、タイトルは「Determining structures of RNA conformers using AFM and deep neural networks」です。
研究の流れ
1. 研究の目的と方法の概要
この研究では、HORNETという新しい手法を提案し、原子間力顕微鏡(AFM)、教師なし機械学習、および深層ニューラルネットワーク(DNN)を組み合わせて、RNA分子の三次元トポロジー構造を解析することを目指しています。HORNET手法の核心は、AFM画像を用いて溶液中の単一RNA分子の高解像度トポロジー情報を捕捉し、機械学習と深層学習アルゴリズムを用いてこれらの情報を分析し、RNAの三次元構造を再構築することにあります。
2. 実験の流れ
a) AFM画像の取得と処理
研究ではまず、AFMを用いてRNA分子をイメージングし、単一RNA分子の高解像度トポロジー画像を取得しました。AFMの利点はその高い信号対雑音比にあり、大きなRNA分子の異なる構造的特徴を捕捉することができます。研究者たちはAFM画像のノイズ推定と解像度分析を行い、画像の品質が後続の構造再構築に十分であることを確認しました。
b) 動的フィッティングとモデル生成
研究者たちは、粗視化分子動力学シミュレーション(coarse-grained molecular dynamics)を用いてRNA分子の動的フィッティングを行い、多数の構造モデルを生成しました。これらのモデルはAFM画像のトポロジー情報によって制約され、生成されたモデルが実験データと一致するように調整されました。動的フィッティングの過程では、AFM擬似ポテンシャル(AFM pseudo-potential)と古典的なGibbs自由エネルギー記述を導入し、モデルを実験データに収束させました。
c) 教師なし機械学習(UML)とモデル選別
動的フィッティングによって生成されたモデルに基づき、研究者たちは教師なし機械学習(UML)を用いてこれらのモデルをクラスタリングし、選別しました。UMLアルゴリズムは、エネルギー情報、AFMトポロジー情報、およびRNAの階層的折りたたみ原理を組み合わせ、実験データに最も適合するモデルを選別しました。主成分分析(PCA)とクラスタリングアルゴリズムを用いて、多数のモデルからエネルギーが最も低く、AFM画像に最も適合するモデルを選び出しました。
d) 深層ニューラルネットワーク(DNN)と精度推定
モデルの精度をさらに向上させるために、研究者たちは深層ニューラルネットワーク(DNN)を開発し、各モデルと真の構造との間の二乗平均平方根偏差(RMSD)を推定しました。DNNは、350万のRNA構造モデルを含むデータベース(PSDatabase)を訓練することで、未知のRNA構造の精度を正確に予測することができます。DNNの訓練と検証プロセスは、特にRMSDが7 Å未満の範囲で、この手法が未知のRNA構造の精度を効果的に推定できることを示しました。
e) 検証と応用
研究者たちはHORNET手法を複数のRNA分子に適用し、RNase P RNAやHIV-1 Rev応答要素(RRE)RNAなどの構造を解析しました。AFM画像とHORNET手法を用いて、これらのRNA分子の複数の異性体構造を成功裏に解析し、大きなRNA分子の構造的多様性を解析するこの手法の強力な能力を示しました。
主な結果
AFM画像と構造再構築:研究者たちはAFMを用いてRNase P RNAとHIV-1 RRE RNAの複数の構造を捕捉し、HORNET手法を用いてこれらのRNAの三次元構造を再構築しました。再構築された構造は既知の結晶構造と比較してRMSDが3-6 Åの範囲であり、HORNET手法がRNAのトポロジー構造を正確に解析できることを示しました。
教師なし機械学習の有効性:教師なし機械学習を用いて、動的フィッティングによって生成された多数のモデルから実験データに最も適合するモデルを選別しました。これらのモデルのRMSDは約5 Åであり、UMLアルゴリズムが高品質の構造モデルを効果的に選別できることを示しました。
深層ニューラルネットワークの精度推定:DNNは各モデルと真の構造との間のRMSDを正確に推定し、特にRMSDが7 Å未満の範囲で高い精度を示しました。DNNの予測結果はUMLで選別されたモデルと高い一致を示し、HORNET手法の信頼性をさらに裏付けました。
HIV-1 RRE RNAの構造解析:研究者たちはHIV-1 RRE RNAの複数の構造を解析し、これらの構造がRevタンパク質結合部位間の距離に大きな違いがあることを発見しました。この発見は、HIV-1ウイルスがどのようにしてRRE RNAを特異的に認識するかを理解するための新しい洞察を提供します。
結論と意義
HORNET手法は、AFM、教師なし機械学習、深層ニューラルネットワークを組み合わせることで、大きなRNA分子の構造的多様性解析の課題を解決しました。この手法はRNA分子の高解像度トポロジー情報を捕捉するだけでなく、機械学習アルゴリズムを用いてRNAの三次元構造を正確に再構築することができます。HORNET手法の提案は、RNA構造生物学研究に新しいツールを提供し、RNAの構造空間の理解を加速する可能性があり、特にRNA機能やRNAを標的とした薬剤設計の分野で広範な応用が期待されます。
研究のハイライト
- 革新的な手法:HORNET手法は初めてAFM、教師なし機械学習、深層ニューラルネットワークを組み合わせ、RNAの三次元構造を解析するもので、RNA構造解析分野の空白を埋めるものです。
- 高精度な構造再構築:HORNET手法を用いることで、研究者たちはRNAのトポロジー構造を高精度で再構築し、RMSDが3-6 Åの範囲であることを示しました。これはRNA構造解析におけるこの手法の強力な能力を示しています。
- 広範な応用可能性:HORNET手法は既知のRNA分子の構造解析だけでなく、未知のRNA分子の構造予測にも適用可能であり、RNA機能研究や薬剤設計に新しいツールを提供します。
その他の価値ある情報
研究者たちはまた、HIV-1 Revタンパク質の二量体構造を模倣した新しい分岐ペプチドを設計し、このペプチドがRRE RNAと高い特異性で結合することを示しました。この発見は、新しい抗HIV薬の開発に向けた新たな道筋を提供するものです。