DeepSleepNet : Un modèle de classification automatique des stades du sommeil basé sur l'EEG monocanal brut

2024-06-13 Thu

classification des stades du sommeil apprentissage profond EEG monocanal réseaux neuronaux convolutifs LSTMs bidirectionnels extraction de caractéristiques automatisation

Réseau de Sommeil Profond : Modèle de Scoring Automatique des Stades de Sommeil Basé sur l’EEG à Canal Unique

Introduction

Le sommeil a un impact significatif sur la santé humaine, et surveiller la qualité du sommeil est crucial dans la recherche et la pratique médicale. Traditionnellement, les experts en sommeil évaluent les stades du sommeil en analysant divers signaux physiologiques tels que l’électroencéphalogramme (EEG), l’électro-oculogramme (EOG), l’électromyogramme (EMG) et l’électrocardiogramme (ECG). Ces signaux sont appelés polysomnographes (PSG) et, après classification, sont utilisés pour déterminer l’état de sommeil d’un individu. Cependant, cette méthode manuelle est chronophage et laborieuse, nécessitant des experts pour enregistrer et analyser les données de plusieurs capteurs pendant plusieurs nuits.

Les méthodes automatiques de scoring des stades de sommeil, basées sur de multiples signaux (comme EEG, EOG et EMG) ou un seul signal EEG, ont été largement étudiées. Cependant, la plupart des méthodes existantes reposent sur l’extraction manuelle des caractéristiques, généralement conçues en fonction des propriétés du jeu de données, et ne peuvent pas être généralisées à des populations plus hétérogènes. De plus, peu de méthodes tiennent compte des informations temporelles utilisées pour reconnaître les règles de transition des stades de sommeil. Récemment, l’application de l’apprentissage profond au scoring automatique des stades de sommeil a été validée, mais souvent au détriment des informations temporelles utilisées par les experts en sommeil lors de l’évaluation, ce qui limite les performances.

Introduction de la Source

Cet article intitulé “DeepSleepNet: A Model for Automatic Sleep Stage Scoring Based on Raw Single-Channel EEG” a été rédigé par Akara Supratak, Hao Dong, Chao Wu et Yike Guo, et publié en novembre 2017 dans l’IEEE Transactions on Neural Systems and Rehabilitation Engineering. Les auteurs sont issus du département d’informatique de l’Imperial College London, au Royaume-Uni.

Détails de l’Étude DeepSleepNet

Processus de Recherche

Le modèle DeepSleepNet se compose de deux parties : l’apprentissage des caractéristiques et l’apprentissage résiduel de séquences.

Phase d’Apprentissage des Caractéristiques

Extraction des caractéristiques temporelles invariantes à l’aide de réseaux de neurones convolutionnels (CNN) avec deux tailles de filtre différentes :
- Les petits filtres sont plus adaptés pour capturer les informations temporelles où apparaissent les motifs EEG, tandis que les grands filtres sont adaptés pour capturer les informations de fréquence.
- Chaque CNN est composé de quatre couches convolutionnelles et de deux couches de poolings max, réalisant une convolution unidimensionnelle, une normalisation par lot et une activation ReLU.

   h_s_i = CNN_θ_s(x_i)
   h_l_i = CNN_θ_l(x_i)
   a_i = h_s_i || h_l_i

Où CNN_θ(x_i) représente la fonction qui convertit un segment EEG de 30 secondes en vecteur de caractéristiques. Les sorties sont combinées et transmises à la phase d’apprentissage résiduel de séquences.

Phase d’Apprentissage Résiduel de Séquences

Utilisation d’un réseau de mémoire à long terme bidirectionnel (Bi-LSTM) pour apprendre les informations temporelles :
- Deux couches Bi-LSTM : Apprennent les règles de transition des stades de sommeil, telles que celles du manuel AASM.
- Connexions de raccourci : Recalculent la fonction résiduelle, permettant au modèle de combiner les caractéristiques extraites par CNN avec les informations temporelles apprises à partir de la séquence d’entrée.

   h^f_t, c^f_t = LSTM_θ_f(h^f_t-1, c^f_t-1, a_t)
   h^b_t, c^b_t = LSTM_θ_b(h^b_t+1, c^b_t+1, a_t)
   o_t = h^f_t || h^b_t + FC_θ(a_t)

Paramètres du Modèle :
- Les paramètres des CNN et des LSTM sont configurés pour capturer les informations temporelles et fréquentielles de l’EEG, en utilisant de petits filtres pour capturer les dépendances à long terme et de grands filtres pour capturer les caractéristiques à haute fréquence.
- Des techniques de régularisation comme le dropout et la décroissance du poids L2 sont utilisées pour empêcher le surajustement du modèle.

Algorithme d’Entraînement

Pour entraîner efficacement le modèle, un algorithme en deux étapes a été proposé : 1. Pré-formation : Utilisation d’un ensemble de formation équilibré pour préformer la partie d’apprentissage des caractéristiques afin d’éviter le surajustement. 2. Affinement : Utilisation d’un ensemble de données séquentielles pour affiner le modèle entier, encodant les informations temporelles et ajustant les paramètres des CNN préformés.

Algorithme 1 : Entraînement en deux étapes
1. Étape de pré-formation
   - Suréchantillonner les données
   - Former les CNNs avec des données équilibrées
2. Étape d'affinement
   - Remplacer les CNNs préformés
   - Former le modèle entier avec des données séquentielles

Expérimentation et Résultats

Jeux de Données :
- Jeu de données MASS : Comprend les enregistrements PSG de 62 sujets sains, annotés manuellement en cinq stades de sommeil (W, N1, N2, N3, REM).
- Jeu de données Sleep-EDF : Comprend 20 sujets, les enregistrements PSG sont classés manuellement selon huit catégories du standard R&K, combinant les stades N3 et N4 pour être conformes au standard AASM.
Indicateurs de Performance :
- Utilisation de la validation croisée k-fold pour évaluer les performances du modèle, incluant la précision (Acc), le score F1 macro (mF1), le coefficient κ de Cohen, etc.
Analyse des Résultats :
- DeepSleepNet réalise des scores de précision globale et de mF1 similaires aux méthodes d’extraction manuelle de caractéristiques les plus avancées sur différents ensembles de données EEG à canal unique.
- L’apprentissage bidirectionnel des informations temporelles par LSTM améliore significativement les performances de classification, validant l’efficacité de l’apprentissage résiduel de séquences.
Comparaison avec les Méthodes Existantes :
- Sur les deux jeux de données (MASS et Sleep-EDF), les indicateurs de performance de DeepSleepNet surpassent ou sont équivalents aux méthodes existantes d’extraction manuelle de caractéristiques et aux méthodes d’apprentissage profond sur EEG à canal unique.

Importance et Valeur de la Recherche

Le modèle DeepSleepNet, en combinant CNN et réseau Bi-LSTM, réalise pour la première fois un apprentissage automatique des caractéristiques directement à partir des données EEG brutes à canal unique, sans besoin d’extraction manuelle. Le modèle peut s’adapter à différents taux d’échantillonnage et standards d’évaluation des jeux de données, démontrant une excellente capacité de généralisation. Les résultats de l’étude indiquent que DeepSleepNet offre une méthode plus efficace pour la surveillance à distance du sommeil, éliminant la dépendance à l’annotation manuelle des experts et améliorant l’automatisation et la précision.

Points Forts et Innovations

Architecture de Modèle Innovante : Combine CNN et Bi-LSTM pour extraire des caractéristiques invariantes au temps et apprendre des informations temporelles.
Algorithme d’Entraînement Efficace : La méthode d’entraînement en deux étapes surmonte efficacement le problème du déséquilibre des classes dans les grands ensembles de données.
Grande Capacité de Généralisation : Montre des performances élevées et cohérentes sur différents jeux de données et canaux.

Conclusion et Travaux Futurs

Le modèle DeepSleepNet propose une nouvelle méthode de scoring automatique des stades de sommeil basée sur l’apprentissage profond, sans besoin d’extraction manuelle des caractéristiques, adapté aux données EEG à canal unique. Les futurs travaux consisteront à appliquer ce modèle aux données EEG à canal unique recueillies à partir de dispositifs portables, permettant ainsi une évaluation à distance du sommeil dans des environnements domestiques ou cliniques.