Une approche d'apprentissage profond basée sur l'attention pour la classification des stades du sommeil avec EEG monocanal
L’électronique IEEE (Institut des ingénieurs électriques et électroniques) a publié dans le volume 29 de “Transactions on Neural Systems and Rehabilitation Engineering” de 2021 un article intitulé “A Single-Channel EEG Sleep Stage Classification Method Based on Attention Deep Learning”. Cet article a été rédigé par les chercheurs Emadeldeen Edele, Zhenghua Chen, Chengyu Liu, Min Wu, Chee-Keong Kwoh, Xiaoli Li et Cuntai Guan. Le principal objectif de cet article est de proposer un nouveau modèle de deep learning basé sur l’attention pour la classification automatique des stades de sommeil à partir de signaux électroencéphalographiques (EEG) à canal unique.
Contexte de la recherche
Le sommeil est un processus physiologique important pour les humains, impactant directement tous les aspects de la vie quotidienne. Des recherches montrent que le sommeil de qualité peut améliorer la santé et les fonctions cérébrales, tandis que les interruptions de sommeil peuvent conduire à des troubles comme l’insomnie ou l’apnée du sommeil. Les stades de sommeil (comme le sommeil léger et profond) jouent des rôles clés dans le système immunitaire, la mémoire et le métabolisme. Il est donc crucial de mesurer la qualité du sommeil via la surveillance et la classification des stades de sommeil.
Traditionnellement, les experts du sommeil utilisent des polysomnographies (PSG) pour segmenter les stades de sommeil, incluant des signaux tels que l’EEG, l’électrooculogramme (EOG), l’électromyogramme (EMG) et l’électrocardiogramme (ECG). Ces dernières années, en raison de la commodité de l’EEG à canal unique, son utilisation est devenue attrayante pour la surveillance du sommeil. Les signaux EEG à canal unique sont généralement divisés en segments de 30 secondes, chaque segment étant examiné et classé manuellement par des experts en sommeil dans l’un des six stades suivants : éveil (W), mouvement oculaire rapide (REM) et quatre stades non-REM (N1, N2, N3 et N4). Cependant, ce processus manuel est très complexe, chronophage et laborieux, nécessitant donc des systèmes automatisés de classification des stades de sommeil pour aider les experts.
Motivation et origine de la recherche
Avec l’application des technologies de deep learning dans divers domaines et leurs performances remarquables, les chercheurs ont été inspirés à appliquer ces technologies à la tâche de classification des stades de sommeil automatisée. Cette étude a été réalisée conjointement par des chercheurs de l’Université de technologie de Nanyang, de l’Institut de recherche en communication et infocommunication de Singapour (A*STAR) et de l’Université de Suzhou, et publiée en 2021 dans les “Transactions on Neural Systems and Rehabilitation Engineering” de l’IEEE.
Méthodologie de la recherche
Cadre général
Cet article propose un nouveau modèle de deep learning basé sur le mécanisme d’attention, AttnSleep, qui comprend principalement trois modules : le module d’extraction de caractéristiques, le module d’attention multi-têtes et le module de classification.
Module d’extraction de caractéristiques
Le module d’extraction de caractéristiques est basé sur un réseau de neurones convolutifs multi-résolution (MRCNN) et un recalibrage adaptatif des caractéristiques (AFR). Le MRCNN utilise deux branches de couches de convolution avec des tailles de noyaux différentes pour extraire les caractéristiques haute fréquence et basse fréquence. Le module AFR modélise les interdépendances entre ces caractéristiques via des blocs de compression et excitation résiduelle (Residual SE), optimisant davantage l’extraction des caractéristiques.
Module d’attention multi-têtes
Dans le mécanisme d’attention multi-têtes, des convolutions causales sont appliquées pour capturer la dépendance temporelle des caractéristiques d’entrée. Le mécanisme d’attention multi-têtes permet au modèle de se concentrer sur l’importance des différentes parties des caractéristiques d’entrée et peut traiter ces spécifications en parallèle, réduisant considérablement le temps d’entraînement.
Données et configuration des expériences
L’étude utilise trois ensembles de données publics (Sleep-EDF-20, Sleep-EDF-78 et Sleep Heart Health Study (SHHS)). Chaque ensemble de données contient des signaux EEG à canal unique. Les performances du modèle ont été évaluées à partir des indicateurs telles que le taux de précision global (ACC), le score F1 macro (MF1), le coefficient Kappa de Cohen (κ) et le G-Mean macro. En outre, les performances pour chaque classe ont été mesurées en termes de précision (PR), de rappel (RE), de score F1 (F1) et de G-Mean.
Résultats expérimentaux
Précision de la classification
Les résultats de l’étude montrent que le modèle AttnSleep surpasse les technologies de pointe existantes sur les trois ensemble de données, en particulier dans le traitement des données déséquilibrées. L’étude a utilisé une validation croisée à 20 plis et analysé en détail les résultats à l’aide d’une matrice de confusion.
Performances du modèle
Sur les ensemble de données Sleep-EDF-20, Sleep-EDF-78 et SHHS, la performance pour le stade N1 était la plus mauvaise, avec un score F1 inférieur à 50%, alors que le stade N3 montrait la meilleure performance. Dans différents ensembles de données, les erreurs de classification pour différents stades étaient principalement concentrées dans le stade N2, car N2 constitue la classe principale dans de nombreux ensembles de données.
Conclusion
Le modèle AttnSleep proposé dans cet article montre des performances exceptionnelles dans la tâche de classification automatique des stades de sommeil. Grâce à une excellente capacité d’extraction des caractéristiques et à une efficacité de traitement des relations de dépendance temporelle, le modèle dépasse avec succès les technologies de pointe existantes. Les résultats de l’étude démontrent que le modèle AttnSleep peut maintenir des performances de classification stables et efficaces lors du traitement de différents ensembles de données publics, offrant de nouvelles idées et méthodes pour les applications futures dans le domaine de la surveillance du sommeil.
À l’avenir, la recherche prévoit d’explorer comment utiliser l’apprentissage par transfert et les techniques d’adaptation de domaine afin de permettre aux modèles entraînés sur des ensembles de données étiquetés de s’adapter à des tâches de classification sur d’autres ensembles de données de sommeil non étiquetés.
Valeur de la recherche
Cette recherche présente des innovations significatives tant sur le plan scientifique qu’algorithmique, tout en ayant une valeur pratique importante. La nouvelle architecture de deep learning proposée n’a pas besoin de procéder à une ingénierie des caractéristiques complexe, puisqu’elle peut extraire et calibrer automatiquement les caractéristiques, simplifiant grandement le processus de classification des stades de sommeil. De plus, la conception des modules d’attention multi-têtes et de recalibrage adapté des caractéristiques offre de nouvelles solutions pour les problèmes de classification de séries chronologiques basés sur le deep learning. Ces travaux pionniers feront avancer l’automatisation et l’intelligence dans la surveillance du sommeil, allégeront la charge de travail clinique et permettront à plus de personnes de bénéficier d’une surveillance précise de la qualité du sommeil.