Classification des types de cellules neuronales basée sur les informations électrophysiologiques partagées entre les humains et les souris

L’innovation dans la classification des neurones : Fusion d’informations provenant de données électrophysiologiques humaines et murines

La classification des neurones a longtemps posé un défi majeur à la communauté scientifique. Une classification précise des neurones est essentielle pour comprendre le fonctionnement du cerveau en état de santé et de maladie. Cette étude, dirigée par Ofek Ophir, Orit Shefi et Ofir Lindenbaum de l’Université Bar-Ilan, publiée dans la revue Neuroinformatics, propose un nouveau cadre d’apprentissage automatique pour classifier les neurones en utilisant conjointement des données électrophysiologiques humaines et murines.

Contexte de l’étude

Les neurones sont les unités fondamentales du système nerveux, et leur classification est un problème central en neurosciences depuis la publication par Ramon y Cajal en 1995 de L’Histologie du Système Nerveux de l’Homme et des Vertébrés. La classification des neurones permet une identification cohérente entre différents laboratoires et conditions expérimentales, ce qui est crucial pour comprendre les fonctions cérébrales et leurs altérations dans les états pathologiques.

Origine de l’étude

Cette étude a été réalisée par la Faculté d’Ingénierie et le Centre de Recherche Multidisciplinaire Leslie & Susan Gonda sur le Cerveau de l’Université Bar-Ilan (Ramat-Gan, Israël). L’article a été accepté le 10 juin 2024 et publié dans la revue Neuroinformatics. Le DOI est : https://doi.org/10.1007/s12021-024-09675-5.

Processus de l’étude

Sources de données

Les données de l’étude proviennent principalement de la Allen Cell Types Database (ACTD), qui contient des enregistrements de caractéristiques biologiques de cellules uniques provenant de souris adultes et d’humains. Les données murines incluent des enregistrements de 1920 cellules, tandis que les données humaines comprennent 413 enregistrements de cellules.

Prétraitement des données

En extrayant des caractéristiques électrophysiologiques, l’équipe de recherche a analysé 41 caractéristiques tabulaires électrophysiologiques. Les enregistrements de données comprennent quatre conditions de stimulation : stimulation par bruit, stimulation en rampe, stimulation rectangulaire et stimulation rectangulaire courte, conçues pour induire différents types de réponses de potentiels d’action (AP).

Tâches de recherche

L’étude se divise en deux tâches principales :

  1. Classification des types larges de neurones humains et murins (excitateur et inhibiteur)
  2. Classification des sous-types de neurones murins en utilisant des données électrophysiologiques

Modèles de classification

Deux modèles de réseaux neuronaux ont été utilisés : - Réseau neuronal profond adaptatif de domaine (Domain-Adaptive Neural Network, DANN) - Réseau interprétable localement clairsemé (Locally Sparse Interpretable Network, LSPIN)

Classification adaptative de domaine avec le modèle DANN

Pour pallier la rareté des échantillons de données humaines, l’équipe de recherche a utilisé le modèle DANN pour intégrer les informations communes des données murines dans les données humaines. En alignant la distribution des données des deux domaines, ils ont réalisé une classification inter-domaines.

Classification multi-étiquettes avec le modèle LSPIN

Étant donné la richesse des échantillons murins, l’équipe a utilisé le modèle LSPIN pour traiter la classification de cinq sous-types. Cette approche a surmonté le problème de surapprentissage des données à faible volume en prédisant les caractéristiques les plus informatives de chaque échantillon pour une classification interprétable.

Résultats de l’étude

Tâche 1 : Classification des types larges de neurones humains et murins

Avec le modèle DANN, l’étude a montré que les enregistrements de pinces à courant de cellules entières du cerveau de souris étaient similaires à ceux du cerveau humain. Le modèle a démontré une haute précision dans la classification des types de neurones humains et murins, avec une précision de 95,0% pour les échantillons humains et de 97,4% pour les échantillons murins.

Tâche 2 : Classification des sous-types de neurones murins

Utilisant le modèle LSPIN, l’étude a obtenu une précision exceptionnelle de 91,6% dans la classification des cinq sous-types, surpassant les modèles d’apprentissage automatique traditionnels comme la forêt aléatoire (RF), le classificateur à vecteurs de support (SVC) et XGBoost. De plus, le modèle a fourni une interprétabilité dans la sélection des caractéristiques pour chaque sous-catégorie.

Importance de l’étude

Valeur scientifique

Cette étude utilise une méthode de fusion de données inter-espèces pour améliorer la précision de la classification des neurones, contribuant ainsi à une meilleure compréhension des caractéristiques électrophysiologiques des neurones. Cette méthode pourrait être utilisée pour des applications cliniques en temps réel, fournissant une base pour le diagnostic précoce des maladies et l’élaboration de traitements.

Valeur pratique

Le modèle DANN résout efficacement le problème de la conversion de domaine dans la classification des neurones, permettant au modèle de se généraliser entre différentes espèces tout en maintenant une haute précision. Le modèle LSPIN, quant à lui, réduit le surapprentissage grâce à la sélection des caractéristiques, améliorant l’interprétabilité de la classification, ce qui est particulièrement important pour les applications cliniques.

Points forts de l’étude

  • Classification inter-domaine : En fusionnant les données humaines et murines, l’étude a résolu les problèmes de rareté des données et de conversion de domaine.
  • Interprétabilité du modèle : Le modèle LSPIN fournit non seulement des résultats de classification précis, mais révèle également l’importance des caractéristiques, ouvrant de nouvelles perspectives pour la recherche en biologie des caractéristiques.

Perspectives de recherche futures

Les futures recherches pourraient envisager : 1. D’élargir la portée de la classification à d’autres espèces pour explorer la conservation évolutive des différents types de neurones. 2. D’appliquer la méthode DANN dans un mode non supervisé pour améliorer encore la précision de la classification des données neuronales humaines. 3. D’évaluer la capacité de généralisation des modèles en les testant dans différents laboratoires et conditions expérimentales. 4. D’analyser en profondeur les caractéristiques biologiques de chaque type de neurone pour augmenter l’interprétabilité des prédictions du modèle.

Conclusion

Cette étude apporte de nouvelles perspectives dans les méthodes de classification des neurones en utilisant les modèles DANN et LSPIN, démontrant l’importance de la fusion de données inter-espèces et de la sélection des caractéristiques. Les résultats de cette recherche contribuent non seulement à une meilleure compréhension scientifique mais offrent également des outils fiables pour des applications pratiques.