分子リンカー設計のための等変3D条件付き拡散モデル
早期の医薬品発見に従事する研究者は、およそ10の60乗の可能な分子構造の中から、薬理活性を持つ候補分子を見つけるという大きな課題に直面しています。この問題を解決する1つの有効な方法は、より小さな「フラグメント」分子から始めることで、この戦略はフラグメントベースの医薬品設計(FBDD)と呼ばれています。FBDDプロセスでは、まず計算機を使ってターゲットタンパク質の結合ポケットに結合するフラグメントを選別し、次にそれらのフラグメントを1つの化合物に接続します。フラグメントを接続する際には、フラグメントの幾何学的な構造とタンパク質ポケットの構造を考慮して、高い親和性を持つ潜在的な医薬品分子を設計する必要があります。
この論文では、DiffLinkerという新しいリンカー(linker)分子設計手法を紹介しています。これは3次元Equivariant Diffusionモデルで、任意の数の切断されたフラグメントが与えられた際に、それらのフラグメントを接続するリンカー構造を生成することができます。従来の自己回帰型手法とは異なり、DiffLinkerは2つ以上のフラグメントを接続するリンカーを一度に生成できるため、事前にリンカーの原子数や接続部位を特定する必要がありません。さらに、このモデルではターゲットタンパク質のポケット情報を組み合わせることで、効果的に結合する分子を生成することができます。
本論文は、イリヤ・ガショフらによって執筆されました。筆頭著者はスイス連邦工科大学ローザンヌ校に所属しており、共同著者にはマサチューセッツ工科大学、マイクロソフト AI研究所、オックスフォード大学の研究者が含まれています。この研究成果は、2024年4月の科学雑誌『Nature Machine Intelligence』に掲載されました。
研究者らは最初に、DiffLinkerモデルをZINC、CASFなどのパブリックデータセットで訓練・評価しました。実験の結果、DiffLinkerが生成した分子は、他のリンカー設計手法と比較して、より高い合成アクセシビリティ、より良い薬品性、より高い化学的多様性を持ち、参照分子構造を比較的よく再現することがわかりました。
次に、研究者らは3つ以上のフラグメントを接続する必要がある、より挑戦的なGeomデータセットを提案しました。このデータセットにおいて、DiffLinkerは優れた性能を示し、生成された分子の93%が有効でしたが、他の手法ではほとんど有効な分子を生成できませんでした。
条件付け設定において、研究者らはDiffLinkerにターゲットタンパク質のポケット原子クラウドを入力し、タンパク質ポケットの構造と適合するリンカー構造を生成させました。フラグメントのみから分子を生成する手法と比べて、ポケット情報で条件付けされたDiffLinkerは、より少ないねじれた構造を生成し、より高い結合親和力が予測されました。
最後に、研究者らは3つの実際のケース(HSP90阻害剤、IMPDH阻害剤、JNK阻害剤の設計)を用いてDiffLinkerの薬物設計における実用性を説明しました。結果として、DiffLinkerは文献に報告された既知の活性分子を再現することに成功し、さらに良好な理化学的性質と結合性を持つ新規分子を生成しました。
この研究は、フラグメントベースの医薬品設計に新しい効率的なツールを提供しています。DiffLinkerは異なるフラグメントを接続する構造をより速く、より正確に設計でき、リンカーの原子数や接続部位を自動的に決定することができるため、人手による複雑な設計作業を避けることができます。さらに、タンパク質ポケット情報を条件として生成することで、FBDDストラテジーにより有意義な候補分子を提供できます。総じて、DiffLinkerは極めて高い応用可能性を示しており、新薬の発見と開発を加速する可能性があります。