Réseau Neuronal Convolutionnel d'Attention Multi-Caractéristiques pour le Décodage de l'Imagination Motrice
Le Brain-Computer Interface (BCI) est un moyen de communication reliant le système nerveux à l’environnement extérieur. La Motor Imagery (MI) est la fondation de la recherche BCI, elle se réfère à la répétition interne avant l’exécution du mouvement. Les technologies non invasives, telles que l’électroencéphalographie (EEG), permettent d’enregistrer l’activité neuronale avec une haute résolution temporelle en raison de leur coût-efficacité et de leur commodité. Lorsqu’un sujet imagine déplacer une partie spécifique de son corps, une variation d’énergie (ERD/ERS) survient dans des régions spécifiques du cerveau, variations qui peuvent être enregistrées par EEG et utilisées pour identifier l’intention motrice. Les systèmes BCI basés sur l’imagerie motrice ont fait des progrès significatifs, capables de contrôler des exosquelettes et curseurs. La combinaison avec la réalité virtuelle montre un potentiel particulier pour la réhabilitation post-AVC.
Actuellement, des méthodes de décodage MI de haute performance sont la clé du succès de ces systèmes. Cependant, améliorer les performances de classification de la MI spontanée est un défi majeur comparé à d’autres paradigmes BCI qui dépendent de stimuli externes, comme les potentiels évoqués liés à l’événement (ERP) et les potentiels évoqués visuels en état stable (SSVEP), en raison du faible rapport signal-bruit et de la variabilité inter-individuelle.
Cet article est rédigé par Yiyang Qin, Banghua Yang, Sixiong Ke, Peng Liu, Fenqi Rong et Xinxing Xia, affiliés à la Faculté de Génie Mécanique et Électrique et d’Automatisation de l’Université de Shanghai et d’autres instituts de recherche, et publié dans le volume 32 de 2024 de la revue “IEEE Transactions on Neural Systems and Rehabilitation Engineering”.
Flux de recherche
1. Jeu de données et prétraitement
Deux jeux de données ont été utilisés dans cette recherche : le jeu de données BCI Competition IV-2a de 2008 et le jeu de données MI BCI du World Robot Conference 2019. L’ensemble complet a été prétraité via la bibliothèque MNE, incluant un filtrage passe-bande de 0.5-40Hz pour éliminer les interférences telles que les mouvements oculaires et musculaires.
2. Conception de l’architecture M-FANet
Cet article propose un réseau neuronal convolutif léger à attention multi-caractéristiques (Multi-Feature Attention Neural Network, M-FANet). Ce modèle inclut plusieurs couches convolutives pour l’extraction des caractéristiques et comporte trois modules d’attention distincts pour l’alignement spatial dans le domaine fréquentiel et des cartes de caractéristiques : - Module d’attention des bandes de fréquence : utilise un filtre de type Chebyshev II pour extraire des données EEG multi-bandes et fusionner les informations à l’aide d’une convolution ponctuelle. - Module d’attention spatiale locale : extrait les caractéristiques spatiales locales des données EEG via un petit noyau de convolution, se concentrant sur les régions cérébrales associées à la MI. - Module d’attention des cartes de caractéristiques : calcule les cartes de caractéristiques par une couche de pooling global et dense et ajuste automatiquement les cartes caractéristiques via un Squeeze-and-Excitation Block (SEBlock), priorisant ainsi le traitement.
3. Méthode d’entraînement R-Drop
Une méthode d’entraînement nommée Regularized Dropout (R-Drop) est introduite, en ajoutant un terme de régularisation pour réduire la variation entre les sous-modèles et améliorer la capacité de généralisation du modèle.
Résultats de la recherche
1. Évaluation des performances
Sur le jeu de données BCI Competition IV-2a, M-FANet a atteint un taux de précision à quatre catégories de 79.28%, avec une Kappa de 0.7259 ; sur le jeu de données WRC MI, un taux de précision à trois catégories de 77.86%, avec une Kappa de 0.6650. Les expériences montrent que les performances de M-FANet surpassent les méthodes de décodage MI les plus récentes.
2. Expériences d’ablation
Une série d’expériences d’ablation a validé la contribution des modules d’attention multi-caractéristiques de M-FANet dans l’attention des bandes de fréquence, l’attention spatiale locale et l’attention des cartes de caractéristiques. La suppression de chaque module a entraîné une baisse des performances, démontrant leur importance dans le modèle.
Conclusion et Signification
Le réseau neuronal convolutif léger à attention multi-caractéristiques M-FANet proposé dans cet article améliore de manière significative la performance de classification des tâches MI grâce à la sélection efficace des caractéristiques de bande de fréquence, des caractéristiques spatiales locales et des mécanismes d’attention. La méthode d’entraînement R-Drop réduit l’overfitting en contraignant la disparité des sorties entre les sous-modèles. M-FANet atteint un équilibre entre performance et exigences en mémoire, montrant son potentiel dans la recherche et les applications BCI basées sur la MI.
Points forts et Valeur
- Conception innovante : utilise des modules d’attention multi-caractéristiques pour un traitement efficace des données et une extraction de caractéristiques.
- Performances excellentes : validées par de nombreuses expériences, les performances de classification de M-FANet surpassent les méthodes de décodage MI existantes.
- Architecture légère : assure une haute précision tout en consommant moins de ressources.
- Large potentiel d’application : particulièrement adapté aux dispositifs portables et embarqués à ressources limitées, offrant une grande perspective d’application.
Prochains travaux
Les futurs travaux envisagent d’appliquer M-FANet à d’autres paradigmes BCI, tels que ERP, et d’explorer des méthodes de segmentation de bande passante non fixes pour identifier des informations de valeur. De plus, il est prévu d’investiguer l’application de l’apprentissage par transfert pour améliorer davantage les performances du modèle sur différents jeux de données.