Une évaluation systématique de l'alignement euclidien avec l'apprentissage profond pour le décodage EEG

Évaluation systématique de l’alignement euclidien avec l’apprentissage profond pour le décodage de l’EEG

Introduction

Les signaux électroencéphalographiques (EEG) sont largement utilisés dans les interfaces cerveau-machine (BCI) en raison de leur nature non invasive, de leur portabilité et de leur faible coût d’acquisition. Cependant, les signaux EEG présentent des inconvénients tels qu’un faible rapport signal/bruit, une sensibilité à l’emplacement des électrodes et une faible résolution spatiale. Avec les progrès de l’apprentissage profond (DL), cette technique a montré d’excellentes performances dans le domaine des BCI, surpassant même les méthodes d’apprentissage machine traditionnelles dans certains cas. Cependant, la principale limitation du DL est sa grande demande en données. L’apprentissage par transfert (Transfer Learning, TL) sur les données de plusieurs sujets, en partageant les données, permet d’entraîner plus efficacement les modèles DL. L’alignement euclidien (Euclidean Alignment, EA) a suscité un intérêt croissant en raison de sa facilité d’utilisation, de sa faible complexité de calcul et de sa compatibilité avec les modèles DL. Mais peu d’études ont évalué les effets de la combinaison de l’EA avec le DL sur l’entraînement de modèles globaux et individuels. Cet article vise à évaluer systématiquement l’impact de la combinaison de l’EA et du DL sur les performances d’entraînement pour le décodage des signaux BCI.

Source de l’article et informations sur les auteurs

Cet article intitulé “Systematic Evaluation of Euclidean Alignment with Deep Learning for EEG Decoding” a été rédigé par Bruna Junqueira, Bruno Aristimunha, Sylvain Chevallier et Raphael Y. De Camargo, issus respectivement de l’Université de São Paulo, de l’Université Paris-Saclay (Inria TAU Team, LISN-CNRS) et de l’Université Fédérale de l’ABC. L’article a été publié dans une revue académique, avec Bruna Junqueira (brunaafl@usp.br) comme auteur correspondant.

Méthodologie de recherche

Cadre de décodage EEG

Le décodage EEG est d’une importance cruciale dans les BCI, consistant à classer les états mentaux à partir des signaux enregistrés. L’ensemble de données E est constitué de n paires (x_i, y_i) d’essais et d’étiquettes. Où x est une matrice de c lignes et t colonnes, c étant le nombre de canaux et t le nombre d’étapes temporelles. L’espace de caractéristiques est X ∈ R^c×t. Cette étude se concentre uniquement sur le paradigme d’imagination motrice gauche-droite, donc l’espace des étiquettes de classification est {‘left_hand’, ‘right_hand’}.

Compte tenu de la variabilité des signaux cérébraux, on suppose que les distributions marginales p_k(·) diffèrent d’un sujet à l’autre. Il existe une fonction de décision inconnue fθ(·) dont les paramètres θ satisfont fθ(x) = y. En alimentant un réseau de neurones avec les données étiquetées et en minimisant la perte moyenne ℓ :

[ \min_θ \frac{1}{nt} \sum{i=1}^{n_t} ℓ(fθ(x_i), y_i) ]

Toutes les expériences utilisent une perte de log-vraisemblance négative et un optimiseur AdamW.

Cadre d’apprentissage par transfert

Un domaine d est défini par l’espace de caractéristiques X et la distribution marginale p(x), tandis qu’une tâche t est définie par l’ensemble des étiquettes Y et la fonction de décision f(X). Chaque individu est considéré comme un domaine, le domaine source étant le domaine de connaissances connu et le domaine cible étant le domaine inconnu. Le cadre d’apprentissage par transfert consiste à entraîner un modèle sur un domaine source (D_s) et une tâche source (T_s), puis à l’appliquer sur un domaine cible (D_t) et une tâche cible (T_t).

Alignement euclidien

L’alignement euclidien (EA) réduit les différences entre les sujets en faisant correspondre la matrice de covariance moyenne de tous les essais de chaque sujet à la matrice identité. En supposant n essais pour chacun des n sujets, la matrice de covariance moyenne est définie par :

[ R̄j = \frac{1}{n} \sum{i=1}^{n} X_j_i X^T_j_i ]

La matrice de transformation est la racine carrée inverse de R̄j, et est appliquée à chaque essai.

Ensembles de données

Deux ensembles de données ont été utilisés : le Dataset IIA (BNCI2014) de la BCI Competition 4 et Schirrmeister2017 (HighGamma). BNCI2014 contient les données de 9 sujets sains effectuant des tâches d’imagination motrice de la main gauche, de la main droite, des deux pieds et de la langue. HighGamma contient les données de 14 sujets sains effectuant des tâches d’imagination motrice de la main gauche, de la main droite, des deux pieds et de repos. Seules les données de la main gauche et droite ont été utilisées pour assurer la cohérence des résultats. Un prétraitement standard comprenant un filtrage passe-bande et un rééchantillonnage a été appliqué.

Modèles et partitionnement des données

L’étude a analysé l’application de l’EA dans deux scénarios :

  1. Utilisation des données de tous les sujets sources (modèle cross-subject).
  2. Utilisation des données de chaque sujet source (modèles individuels).

Une tâche de classification binaire du paradigme d’imagination motrice a été utilisée, où le paradigme d’imagination motrice du sujet cible a été évalué pour éviter les fuites d’informations entre les ensembles de test, de validation et d’entraînement.

EEGNet, ShallowNet et DeepNet ont été utilisés comme modèles d’évaluation pour garantir une comparaison équitable.

Alignement des données

Dans les expériences hors ligne et pseudo-en ligne, l’alignement EEG a été réalisé différemment. Dans les expériences hors ligne, tous les essais de chaque sujet ont été alignés. Dans le cas pseudo-en ligne, seuls les 24 premiers essais du sujet cible ont été utilisés pour calculer la matrice de référence et aligner les données de test.

Entraînement des modèles

Le modèle cross-subject a utilisé une validation croisée leave-one-subject-out, tandis que les modèles individuels ont été entraînés sur l’ensemble des données, avec 20% pour la validation. Un modèle séparé a été entraîné pour chaque sujet cible, évaluant un scénario d’entraînement many-to-many. Pendant l’entraînement, la taille des lots était de 64, avec 1000 époques, un arrêt précoce après 250 époques sans amélioration, un dropout de 25%, et des taux d’apprentissage et de décroissance des poids optimisés.

Résultats de la recherche

Alignement euclidien dans l’apprentissage par transfert

L’alignement euclidien a amélioré les performances de décodage pour tous les ensembles de données et architectures évalués. La méthode EA-offline entraînée sur les données de tous les sujets a augmenté la précision de 1,26% par rapport au paradigme d’imagination motrice non aligné, tandis que EA-online a globalement augmenté la précision de 4,33% par rapport au cas non aligné, réduisant d’environ 70% le temps d’entraînement.

Impact du réglage fin sur les modèles partagés

Le réglage fin sans alignement a entraîné une augmentation moyenne de la précision de 1,43%. Le réglage fin des modèles EA-offline et EA-online n’a montré aucune amélioration significative, suggérant que l’EA a déjà rendu les distributions de données très cohérentes, nécessitant davantage de données cibles pour bénéficier du réglage fin.

Analyse de la transitivité entre les sujets

L’alignement euclidien a amélioré la transitivité des modèles individuels entre les sujets. Les bons donneurs ont tendance à être de bons receveurs, et l’EA a renforcé cette corrélation en rendant les distributions de données plus cohérentes. Cependant, l’EA n’a pas modifié la structure des bons/mauvais donneurs.

Utilisation de classificateurs par vote dans l’apprentissage par transfert

L’EA a nettement amélioré la transitivité des modèles individuels. En utilisant un classificateur par vote pondéré majoritaire pour classer le sujet cible avec différentes combinaisons de modèles individuels, l’EA a permis une augmentation moyenne de la précision de 3,71%. Comparé aux modèles partagés, une baisse moyenne de la précision de 3,62% a été observée. Cependant, le classificateur par vote est plus flexible, permettant d’ajouter de nouvelles sources de données sans avoir à ré-entraîner l’ensemble du modèle.

Signification et valeur

Cette étude a montré que l’alignement euclidien est une puissante technique d’adaptation de domaine, performante lorsqu’elle est combinée au DL. L’EA a considérablement amélioré la précision de décodage et le temps d’entraînement des modèles utilisant les données de plusieurs sujets. Lors de l’entraînement de modèles cross-subject, l’EA devrait être une étape de prétraitement standard. Les futurs travaux pourraient explorer davantage la convergence rapide de l’EA avec les modèles DL et l’impact des différents hyperparamètres sur les performances du modèle, ouvrant la voie à des applications plus larges.

En évaluant systématiquement l’application de l’EA avec le DL pour le décodage de l’EEG, cette étude a non seulement fait progresser la technologie dans le domaine des BCI, mais a également ouvert de nouvelles perspectives de recherche. Les résultats ont révélé le potentiel de l’EA pour réduire la variabilité inter-sujets des signaux, fournissant ainsi une voie plus efficace pour l’apprentissage par transfert et des orientations importantes pour les applications pratiques des BCI.