Évaluation complète des pipelines pour la classification des troubles psychiatriques utilisant des ensembles de données fMRI au repos multi-sites

Contexte

Le domaine de la psychiatrie a longtemps dépendu des symptômes et des entretiens médicaux pour établir des diagnostics, en l’absence de biomarqueurs objectifs. L’imagerie par résonance magnétique fonctionnelle au repos (resting-state functional magnetic resonance imaging, rs-fMRI) est largement considérée comme capable de révéler les modèles caractéristiques de la structure et de la fonction cérébrales, offrant ainsi des marqueurs de classification potentiels pour le diagnostic des troubles mentaux. Cependant, en raison de la diversité des pipelines d’analyse, aucun marqueur largement accepté n’a encore été établi. Le choix des différents pipelines d’analyse a un impact significatif sur les performances de diagnostic et de généralisation, mais peu d’études ont systématiquement exploré les pipelines idéaux. Par conséquent, cette étude vise à évaluer de manière exhaustive les pipelines d’analyse pour les marqueurs de classification du trouble dépressif majeur (major depressive disorder, MDD) en utilisant un ensemble de données rs-fMRI à grande échelle et multi-sites, dans le but de fournir un processus standardisé pour le diagnostic des troubles mentaux.

Source de l’article

Évaluation complète des pipelines de classification des troubles psychiatriques utilisant des ensembles de données rs-fMRI multi-sites

Cet article est le fruit d’une collaboration entre plusieurs institutions de recherche japonaises, avec comme principaux auteurs Yuji Takahara, Yuto Kashiwagi, Tomoki Tokuda, entre autres. L’équipe de recherche provient de l’Advanced Telecommunications Research Institute International, de Shionogi & Co., Ltd., de l’Université de Tokyo, entre autres. L’article a été publié en ligne le 28 février 2025 dans la revue Neural Networks, avec le DOI 10.1016/j.neunet.2025.107335.

Processus de recherche

1. Ensembles de données et prétraitement

L’étude a utilisé trois ensembles de données : - Ensemble de données I : Comprend 713 participants (564 témoins sains et 149 patients MDD), provenant de quatre sites, avec des données collectées selon un protocole unifié. - Ensemble de données II : Comprend 449 participants (264 témoins sains et 185 patients MDD), provenant de quatre sites indépendants, avec des données collectées selon des protocoles hétérogènes. - Ensemble de données III : Comprend 231 participants (125 patients atteints de trouble du spectre autistique et 106 patients atteints de schizophrénie), utilisé pour valider la généralisation des pipelines.

Le prétraitement des données a été effectué à l’aide de l’outil fMRIprep, comprenant la correction du temps de coupe, la correction du mouvement, la co-enregistrement, la correction de distorsion, la segmentation des images pondérées en T1 et la normalisation.

2. Construction des pipelines d’analyse

L’étude a exploré des combinaisons d’options dans quatre sous-processus : - Parcellation cérébrale : Six méthodes, telles que la parcellation de surface de Glasser, l’atlas de Shen, et l’apprentissage de dictionnaire basé sur les données. - Estimation de la connectivité fonctionnelle (FC) : Quatre méthodes, telles que la corrélation totale de Pearson, la covariance dans l’espace tangent, la corrélation partielle et la corrélation de distance. - Correction des différences entre sites : Trois méthodes, telles que la correction par sujet voyageur, la correction Combat et l’absence de correction. - Méthodes d’apprentissage automatique : Cinq méthodes, telles que Lasso, la régression logistique sparse, Ridge, les machines à vecteurs de support (SVM) et la forêt aléatoire.

En combinant ces options, 360 marqueurs de classification MDD différents ont été construits.

3. Construction et validation des marqueurs de classification

L’ensemble de données I a été utilisé comme ensemble de découverte pour construire les marqueurs de classification MDD, évalués par validation croisée imbriquée à 10 plis (cross-validation, CV). Ensuite, les marqueurs ont été appliqués à l’ensemble de données II pour une validation indépendante. Pour exclure la dépendance à l’ensemble de données, les rôles des ensembles de données I et II ont été inversés, et le processus a été répété.

4. Évaluation des performances

Les métriques d’évaluation incluent l’aire sous la courbe (area under the curve, AUC), l’exactitude, la sensibilité, la spécificité et le coefficient de corrélation de Matthews (MCC). L’étude a également défini deux indicateurs personnalisés, le “score composite” (composite score) et l’“instabilité” (instability), pour évaluer de manière exhaustive les performances des marqueurs.

5. Analyse de la similarité des marqueurs

L’étude a analysé la similarité des résultats de classification et des poids des 10 meilleurs marqueurs pour vérifier leur cohérence. En cartographiant la connectivité fonctionnelle sur les réseaux cérébraux de Yeo et al., les taux d’utilisation des réseaux pour les connexions fonctionnelles importantes ont été comparés.

6. Application à d’autres troubles mentaux

Les 10 meilleurs pipelines ont été appliqués aux ensembles de données du trouble du spectre autistique (ASD) et de la schizophrénie (SCZ) pour valider leurs performances de classification dans ces troubles.

Résultats principaux

1. Comparaison des performances de classification

L’étude a révélé que la parcellation de surface de Glasser et l’apprentissage de dictionnaire basé sur les données étaient les meilleures méthodes de parcellation cérébrale, tandis que la corrélation totale de Pearson et la covariance dans l’espace tangent étaient les meilleures méthodes d’estimation de la connectivité fonctionnelle. Pour la correction des différences entre sites, la correction par sujet voyageur et l’absence de correction ont donné des résultats similaires, tandis que la correction Combat a montré des performances significativement inférieures. Parmi les méthodes d’apprentissage automatique, les méthodes non sparse (comme Ridge et SVM) ont surpassé les méthodes sparse.

2. Validation par inversion des rôles des ensembles de données

En inversant les rôles des ensembles de données I et II, l’étude a validé la capacité de généralisation des pipelines. Les résultats ont montré que la parcellation de surface de Glasser et la corrélation totale de Pearson étaient stables dans différents rôles d’ensembles de données.

3. Similarité des marqueurs

Les 10 meilleurs marqueurs ont montré une forte cohérence dans les résultats de classification, et les modèles de poids étaient très similaires pour 8 d’entre eux. Deux marqueurs utilisant la parcellation basée sur les données et la covariance dans l’espace tangent avaient une similarité de poids plus faible avec les autres marqueurs, suggérant qu’ils capturaient des caractéristiques différentes du MDD.

4. Application à d’autres troubles mentaux

Pour la classification de l’ASD et de la SCZ, 8 des 10 meilleurs pipelines ont montré des performances de classification suffisantes, indiquant leur potentiel d’application à d’autres troubles mentaux.

Conclusion et signification

Cette étude a évalué de manière exhaustive les pipelines d’analyse pour les marqueurs de classification du MDD en utilisant un ensemble de données rs-fMRI à grande échelle et multi-sites, et a identifié les meilleures options en matière de parcellation cérébrale, d’estimation de la connectivité fonctionnelle, de correction des différences entre sites et de méthodes d’apprentissage automatique. Les résultats montrent que la parcellation de surface de Glasser, la corrélation totale de Pearson, l’absence de correction et les méthodes d’apprentissage automatique non sparse excellent dans la construction de marqueurs de classification avec une forte capacité de généralisation. De plus, ces pipelines ont montré de bonnes performances dans la classification de l’ASD et de la SCZ, offrant un processus standardisé pour le diagnostic des troubles mentaux.

Points forts de l’étude

  1. Évaluation systématique : Cette étude est la première à évaluer systématiquement plusieurs méthodes avancées (comme la parcellation de surface de Glasser, la corrélation de distance et la correction des différences entre sites) dans un cadre unifié.
  2. Validation de la généralisation : En inversant les rôles des ensembles de données, l’étude a validé la robustesse des pipelines dans différents ensembles de données.
  3. Application à plusieurs troubles : L’application des 10 meilleurs pipelines à l’ASD et à la SCZ a démontré leur potentiel d’application à divers troubles mentaux.

Autres informations utiles

Les données et le code de cette étude sont disponibles via le référentiel de données cérébrales du projet DECNEF (https://bicr.atr.jp/decnefpro/data), offrant une ressource précieuse pour d’autres chercheurs.