機械学習と組合化学を使用したmRNA送達のための可イオン化脂質発見の加速

机器学習と組合せ化学を利用してmRNA送達のための可イオン化脂質の発見を加速する

研究背景

メッセンジャーRNA(mRNA)治療の潜在能力を最大限に引き出すためには、脂質ナノ粒子(LNPs)のツールキットを拡張することが重要です。しかし、LNPs開発の主要なボトルネックは、新しい可イオン化脂質を識別することである。既存の研究では、LNPsが特定の組織または細胞にmRNAを送達するのに顕著な効果を示していることが明らかにされています。クラシックなLNPsの処方は通常、イオン化脂質、コレステロール、補助脂質、及びポリエチレングリコール化脂質(PEG脂質)から構成されており、特にイオン化脂質はmRNAの積載及びエンドソームからの逃避において重要な役割を果たしている。

近年、LNPsは臨床応用の分野で大きな進展を遂げています。例えば、アメリカ食品医薬品局(FDA)は、遺伝性アミロイドーシスに対するショートヘアピンスイッチRNA(siRNA)薬Onpattro、およびModernaとPfizer/BioNTechが共同開発した2つのSARS-CoV-2ワクチンを承認しました。それにもかかわらず、FDAが承認した各LNPsの処方には独自のイオン化脂質が含まれています。従来の化学反応プラットフォームへの依存に加えて、新しいmRNA送達脂質の発見を加速する方法は依然として大きな課題です。

論文出典

この研究論文は「機械学習と組合せ化学を利用してmRNA送達のための可イオン化脂質の発見を加速する」というタイトルで、Bowen Li、Idris O. Raji、Akiva G. R. Gordonなどによって執筆されており、麻省理工学院、ボストン児童病院、ミシガン大学、トロント大学などの機関に所属しています。この論文は《Nature Materials》に掲載され、発表日は2024年3月です。

研究フロー

研究ステップ

  1. 化学多様性ライブラリの作成: 研究は簡単な四成分反応プラットフォームから始まり、584種類の化学的に多様な可イオン化脂質ライブラリが作成されました。これらの脂質は、アミン、イソニトリル、アルデヒド、そしてカルボン酸を反応物として含む四成分反応(4CR)システムを通じて合成されました。

  2. LNPsのスクリーニングと基本データセットの構築: 最初にこれらの脂質を含むLNPsのmRNA転写効率をスクリーニングし、そのデータを様々な機械学習モデルの基礎データセットとして使用しました。

  3. 機械学習モデルの訓練と選定: 584種類の脂質のmRNA転写結果を使用して、ランダムフォレスト、ロジスティック回帰、及び勾配ブースティングの三つの非線形機械学習(ML)アルゴリズムを訓練し、その中でXGBoostアルゴリズムが最良の結果を示しました。ランダム分割と過度なサンプリング技術を使用してMLアルゴリズムの潜在的な偏りを軽減し、各脂質の化学構造を表示するためにPaDEL-Descriptorソフトウェアで生成された分子記述子を使用しました。

  4. 仮想脂質ライブラリのスクリーニングと実験検証: 最も優れたモデルを選び、40,000種類の脂質を含む仮想ライブラリを探索し、選ばれた16種類の脂質を合成して実験で検証した。

  5. 新型脂質119-23の発見と性能評価: 複数の組織においてその筋肉と免疫細胞の転写効率が既知の基準脂質を上回る脂質、119-23を特定した。

方法と実験の詳細

  1. 化学成分の選定と反応デザイン: 研究チームは、4CRシステムを通じて、3種類の異なるアミン(ヘッド基)、4種類の異なるイソニトリル(リンカー基)、8種類の異なるアルデヒド(テール基1)、及び4種類の異なるカルボン酸(テール基2)を組み合わせて384種類の化学的に多様なイオン化脂質を合成しました。

  2. 機械学習アルゴリズムの具体的な応用: 機械学習モデルは、生成された2,014種類の分子記述子を利用して、脂質がmRNA送達においてどのように振る舞うかを予測しました。XGBoostアルゴリズムはROC-AUCとPR-AUCにおいて最良のパフォーマンスを示し、最終的に予測モデルとして選択されました。

  3. 実験検証と最適化: 16種類の新しい脂質を合成し、i.m.注射を通じてマウスにおいてこれらの脂質の転写効率をテストしました。脂質119-23は顕著な転写効率を示しました。特に筋肉や多数の免疫細胞においては対照脂質以上のパフォーマンスを示しました。

研究結果

主な結果

  1. 初期スクリーニングとデータセット構築: 高スループットスクリーニングを通じて、研究チームはHeLa細胞およびマウス体内で584種類のイオン化脂質のmRNA転写データを取得し、基本データセットを構築しました。

  2. 最良モデルの選択と大規模スクリーニング: XGBoostモデルが最良のパフォーマンスを示し、40,000種類の脂質を含む仮想ライブラリをスクリーニングするために採用しました。そこから上位16種類の優れた脂質を識別し、さらなる実験で検証しました。

  3. 脂質119-23の発見と検証: 脂質119-23は、複数の組織においてmRNA転写効率が基準脂質を上回り、特に筋肉と免疫細胞において顕著なパフォーマンスを示しました。

研究結論

結論と意義

機械学習と4CR化学反応を組み合わせることにより、研究チームは可イオン化脂質の迅速かつ効率的なスクリーニング方法を開発し、新型のmRNA送達脂質の発見サイクルを大幅に短縮しました。脂質119-23の顕著な性能は、様々な細胞タイプにおけるmRNAの転写効率を向上させ、広範囲の応用可能性を示しています。

ハイライトと斬新性

  1. 革新的な組合せ化学プラットフォーム:4CRプラットフォームを使用した可イオン化脂質の高スループットスクリーニングは、三成分反応と比較して合成効率と生産性を大幅に向上させました。
  2. 分子スクリーニングにおける機械学習の応用:機械学習技術を組み合わせることで、大規模な化合物ライブラリのスクリーニングの効率を向上させました。XGBoostモデルはスクリーニングで最良のパフォーマンスを示しました。
  3. 新型脂質119-23の発見:複数の組織においてmRNA送達効果が市販の基準脂質を上回り、ワクチンおよび治療用タンパク質置換療法の分野での潜在能力を示しました。

その他の情報

研究はまた、脂質成分がmRNA送達において具体的にどのように機能するかについて深く掘り下げ、分子記述子を通じて脂質成分と転写効率の関係を明らかにしました。これらの研究成果は、可イオン化脂質の化学ライブラリを豊かにするだけでなく、将来のmRNA治療に新しいツールと方法を提供しました。研究は、機械学習と組合せ化学の創造的な結合を通じて、mRNA送達脂質の開発を加速する新しい道を切り開き、mRNA治療の展望を広げました。