brainlife.io : une plateforme cloud décentralisée et open-source pour soutenir la recherche en neurosciences
Rapport universitaire : brainlife.io : une plateforme cloud décentralisée et open-source pour soutenir la recherche en neuroscience
Contexte et motivations
La recherche en neurosciences évolue rapidement, l’amélioration des outils de normalisation, de gestion et d’analyse des données rend la recherche plus rigoureuse et transparente. Cependant, cela entraîne également une complexification des pipelines de données, ce qui peut constituer un obstacle à l’application du principe “FAIR” (Findable, Accessible, Interoperable, Reusable, traduit par “Trouvable, Accessible, Interopérable et Réutilisable”). Traditionnellement, certaines recherches en neuro-imagerie pouvaient être menées au sein d’un seul laboratoire, mais aujourd’hui, elles nécessitent souvent des heures de mesure des données, impliquant multiples participants, laboratoires et modèles de données.
Contexte des données
La plateforme brainlife.io décrite dans cet article vise à simplifier et à démocratiser la recherche en neuro-imagerie en soutenant la normalisation, la gestion, la visualisation et l’analyse des données. Cette plateforme suit automatiquement l’historique de milliers d’objets de données, rendant ainsi le traitement des grands ensembles de données plus transparent et efficace.
Source de l’article
Cet article a été rédigé par Soichi Hayashi, Bradley A. Caron et son équipe, dont les membres proviennent de l’Indiana University, University of Texas, Vanderbilt University et d’autres institutions de recherche. L’article a été publié le 11 mai 2024 dans la revue “Nature Methods”.
Processus de recherche
Conception du workflow
L’équipe de recherche a développé la plateforme brainlife.io afin de simplifier les pipelines de traitement des données complexes, à la manière de l’algorithme MapReduce de Google. Tout d’abord, par un processus de prétraitement en parallèle, les caractéristiques d’intérêt (activation fonctionnelle, carte de la substance blanche, réseaux cérébraux ou données de séries chronologiques) sont extraites. Ensuite, les données sont analysées et les graphiques sont générés à l’aide de carnets Jupyter préconfigurés.
Architecture de la plateforme
- Importation des données : Les ensembles de données sont importés via https://brainlife.io/datasets et la plateforme soutient les principaux standards de données.
- Gestion et stockage des données : La gestion des données s’organise autour de “projets” en utilisant un système de stockage sécurisé.
- Traitement des données : Le traitement s’effectue grâce à des microservices automatisés et une gestion des données décentralisée, suivant chaque étape les ID d’objets de données, les versions d’applications et les ensembles de paramètres.
- Extraction de caractéristiques et analyse : Les caractéristiques statistiques sont extraites et analysées pour produire des structures de “données ordonnées”.
- Publication des résultats : Les résultats, le code et les données sont publiés à travers des enquêtes scientifiques.
Utilisation de la plateforme
Avec Brainlife.io, les chercheurs peuvent télécharger et analyser les données provenant de systèmes MRI, MEG et EEG. Les données sont gérées de manière sécurisée et peuvent être prétraitées et visualisées à l’aide d’applications à contrôle de version.
Échantillons et sources de données
La recherche a utilisé des données de plus de 1800 participants provenant de trois ensembles de données (PING, HCP, Cam-CAN) qui couvrent sept groupes d’âge (3-88 ans). L’étude a validé l’utilité scientifique de la plateforme sous différents régimes de données.
Expériences et résultats
Expérience 1 : Traitement des données et extraction de caractéristiques
Brainlife.io a été utilisé pour traiter les participants des trois ensembles de données et tracer des trajectoires de vie, y compris le volume des régions du cerveau et la FA (Fractional Anisotropy) des faisceaux de matière blanche, avec des résultats cohérents avec les recherches antérieures. Avec Brainlife.io, les différents ensembles de données ont pu être intégrés pour identifier les trajectoires de vie cérébrale déjà établies.
Expérience 2 : Réplication et généralisation des résultats
Une application a été créée pour estimer l’épaisseur du cortex et l’indice de dispersion de l’orientation des tissus (ODI), testant l’ensemble de données HCP1200, vérifiant une relation négative et en généralisant les résultats à l’ensemble de données Cam-CAN. De plus, la recherche a répliqué la découverte de Hason et al. que le stress de la vie est associé à la structure de la matière blanche du préhippocampe bilatérale.
Expérience 3 : Tests cliniques
L’impact des troubles oculaires sur la matière blanche des radiations visuelles a été étudié: en comparant les patients atteints de rétinopathie en étoile, les patients atteints de tumeurs choroïdiennes et un groupe témoin sain, il a été découvert que les changements de la structure de la matière blanche associés à différents types de maladies correspondent exactement à leurs modes spécifiques de dégénérescence périphérique ou centrale de la rétine.
Conclusion
Cet article a démontré les performances significatives de la plateforme brainlife.io en termes de validation, de fiabilité, de reproductibilité et d’utilité scientifique, en particulier dans le traitement de la recherche en neurosciences à grande échelle. La plateforme a non seulement favorisé la simplification de la recherche, mais elle a également accru la transparence, l’équité et l’efficacité.
Faits marquants de la recherche
- Démocratisation des outils et des données : Brainlife.io permet à des chercheurs de pays à revenu moyen ou faible et d’institutions de petite taille de faire usage d’outils d’analyse neuroscientifique avancés.
- Pilier de la communauté scientifique ouverte : Lancée à partir de la philosophie de la science ouverte, elle offre des analyses de données neuroscientifiques gratuites, sécurisées et reproductibles.
- Gestion décentralisée et automatisée : La plateforme est basée sur une approche microservices, permettant une gestion et un traitement des données automatisés et décentralisés.
Valeur et signification
La plateforme brainlife.io a favorisé la compréhension des maladies cérébrales, accéléré les progrès de la recherche scientifique et a rendu la recherche en neurosciences plus accessible. La plateforme, en combinant les ressources de stockage de données, les ressources informatiques et les chercheurs de la communauté mondiale, a favorisé la collaboration en matière de recherche et d’éducation, a stimulé le progrès des neurosciences et la découverte de méthodes de traitement.
Remarques et soutien
Brainlife.io a été financée par plusieurs projets, dont le NIH NIBIB et la NSF, et a reçu le soutien du Microsoft Investigator Fellowship, entre autres. Le code de recherche, les bibliothèques de logiciels publics, les ensembles de données, etc. sont tous disponibles sur https://brainlife.io/docs, qui offre des tutoriels complets et des démonstrations vidéo.