Modèle de diffusion conditionnelle 3D équivariant pour la conception de lieur moléculaire

Les chercheurs impliqués dans la découverte précoce de médicaments sont confrontés à un énorme défi : trouver des molécules candidates ayant une activité pharmacologique parmi environ 10^60 structures moléculaires possibles. Une solution réussie consiste à commencer par des molécules “fragmentaires” plus petites, une stratégie connue sous le nom de conception de médicaments basée sur les fragments (FBDD). Dans le processus FBDD, on commence par cribler par ordinateur les fragments se liant à la poche cible de la protéine, puis on relie ces fragments en une seule molécule. Lors de la connexion des fragments, il faut tenir compte de leurs conformations géométriques ainsi que de la structure de la poche protéique afin de concevoir des molécules médicamenteuses potentielles à haute affinité. Processus de génération de la conception de liaison moléculaire

Cet article présente une nouvelle méthode de conception de bras de liaison (linkers) moléculaires appelée DiffLinker. Il s’agit d’un modèle de diffusion 3D équivariant capable de générer des structures de bras de liaison reliant un nombre arbitraire de fragments déconnectés. Contrairement aux méthodes basées sur l’autoregression précédentes, DiffLinker peut générer en une seule fois des bras de liaison reliant deux fragments ou plus, sans avoir à spécifier au préalent le nombre d’atomes du linker ou les sites de liaison. De plus, ce modèle peut également intégrer les informations de la poche cible de la protéine pour générer des molécules capables de se lier efficacement à celle-ci.

L’article a été rédigé par Ilia Igashov et al., le premier auteur étant de l’École Polytechnique Fédérale de Lausanne, avec des collaborateurs du MIT, de Microsoft Research AI, et de l’Université d’Oxford. Ces résultats de recherche ont été publiés en avril 2024 dans la revue Nature Machine Intelligence.

Les chercheurs ont d’abord entraîné et évalué le modèle DiffLinker sur les jeux de données publics ZINC, CASF, etc. Les résultats expérimentaux montrent que, par rapport aux autres méthodes de conception de linkers, les molécules générées par DiffLinker ont une meilleure accessibilité synthétique, de meilleures propriétés drug-like, une plus grande diversité chimique, et reproduisent mieux les structures moléculaires de référence.

Ensuite, les chercheurs ont proposé un nouveau jeu de données Geom plus difficile, dans lequel chaque exemple contient 3 fragments ou plus à relier. Sur ce jeu de données, DiffLinker a démontré des performances exceptionnelles, générant 93% de molécules valides, alors que les autres méthodes ont échoué à générer des molécules valides.

Dans un cadre conditionnel, les chercheurs ont permis à DiffLinker d’intégrer le nuage d’atomes de la poche cible de la protéine pour générer des structures de linkers compatibles avec la conformation de cette poche. Par rapport aux méthodes générant des molécules uniquement à partir de fragments, les molécules générées par DiffLinker sous contrainte de la poche présentent moins de distorsions conformationnelles et des affinités de liaison prédites plus élevées.

Enfin, les chercheurs ont illustré les applications pratiques de DiffLinker dans la conception de médicaments à travers trois cas réels (conception d’inhibiteurs de HSP90, d’IMPDH et de JNK). Les résultats montrent que DiffLinker peut reproduire avec succès les molécules actives connues rapportées dans la littérature et générer de nouvelles molécules avec de meilleures propriétés physicochimiques et d’affinité.

Cette recherche fournit un nouvel outil efficace pour la conception de médicaments basée sur les fragments. DiffLinker permet de concevoir plus rapidement et avec plus de précision les structures reliant différents fragments, en déterminant automatiquement le nombre d’atomes du linker et les sites de liaison, évitant ainsi le processus complexe de conception manuelle. De plus, la génération conditionnelle intégrant les informations de la poche protéique peut fournir des molécules candidates plus pertinantes pour la stratégie FBDD. Dans l’ensemble, DiffLinker montre un potentiel d’application considérable et pourrait accélérer la découverte et le développement de nouveaux médicaments.