L'apprentissage auto-supervisé des données d'accéléromètres fournit de nouvelles perspectives sur le sommeil et sa relation avec la mortalité

De Nouveaux Aperçus sur le Lien entre le Sommeil et la Mortalité Révélés par l’Analyse de Données d’Accéléromètres de Poignet en Auto-apprentissage

Dans la société moderne, le sommeil, en tant qu’activité fondamentale nécessaire à la vie, est d’une importance évidente. Mesurer et classifier avec précision les états sommeil/éveil ainsi que les différentes phases du sommeil est essentiel pour le diagnostic des troubles du sommeil en recherche clinique et pour l’interprétation des données de santé mentale et de mouvement fournies par les dispositifs grand public. Cependant, les technologies de classification du sommeil non polysomnographiques (Polysomnography, PSG) actuelles reposent principalement sur des méthodes heuristiques développées dans des populations échantillons relativement petites, avec certaines limitations. Par conséquent, l’objectif de cette étude est de déterminer l’exactitude de la classification des stades de sommeil à l’aide d’un accéléromètre porté au poignet et d’explorer l’association entre la durée et l’efficacité du sommeil et la mortalité.

Processus de recherche et conception du modèle d’apprentissage automatique

Contexte de l’étude

Écrit par Hang Yuan et son équipe (comprenant Tatiana Plekhanova, Rosemary Walmsley, Amy C. Reynolds, Kathleen J. Maddison, entre autres), cet article a été publié dans la revue npj Digital Medicine en 2024. Le moteur de recherche était de surmonter les limites des méthodes actuelles en application à grande échelle et d’améliorer les techniques de classification des stades de sommeil à travers des méthodes de deep learning en auto-apprentissage.

Le sommeil occupe un tiers de l’activité humaine, mais son évaluation dans un environnement de vie libre est très difficile. Les journaux de sommeil subjectifs, bien qu’ils puissent capturer les sentiments subjectifs des individus, présentent une faible corrélation avec les paramètres objectifs mesurés par les dispositifs. Tandis que le PSG de laboratoire, considéré comme le gold standard pour la mesure du sommeil, offre des données précises, mais son coût élevé et sa complexité en font un outil inadapté aux études à grande échelle. En comparaison, les accéléromètres portés au poignet, en raison de leur portabilité et de leur faible charge pour l’utilisateur, sont plus adaptés aux études épidémiologiques à grande échelle.

Cependant, les algorithmes d’évaluation du sommeil dans les dispositifs portés au poignet de niveau consommateur et recherche sont principalement des technologies propriétaires, validées dans des populations de petite échelle, dont l’efficacité de mesure n’est pas claire. Les méthodes de classification du sommeil (qui distinguent par exemple l’éveil, le sommeil NREM et REM) reposent principalement sur des caractéristiques manuelles, qui pourraient ne pas exploiter toutes les informations présentes dans le signal. Par conséquent, les approches basées sur les données, tels que le deep learning, pourraient offrir un avantage.

Source de l’article

Cet article est rédigé par plusieurs chercheurs de différentes institutions, y compris l’Université d’Oxford, l’Hôpital de Bundang de l’Université nationale de Séoul, etc. L’étude est publiée dans la revue npj Digital Medicine en 2024, citation: https://doi.org/10.1038/s41746-024-01065-0.

Méthodologie et Processus de Recherche

Participants et Collecte des Données

L’étude utilise d’abord l’auto-apprentissage de multiples tâches pour extraire des caractéristiques à partir des données d’accéléromètre tri-axial couvrant 700 000 jours de la UK Biobank. Ensuite, les caractéristiques extraites sont raffinées avec un réseau récurrent profond (Recurrent Neural Network, RNN), en utilisant le PSG comme standard pour entraîner un classificateur de stades de sommeil. Après les exclusions, les données de nuit de 1448 participants sont utilisées pour entraîner le modèle. Pour la validation interne, 1395 participants sont inclus, et pour la validation externe, 53 participants.

Comparaison avec le Polysomnographe

Lors de la validation interne, comparé au PSG, le modèle montre une déviation du temps total de sommeil de 8,9 minutes (Intervalle de Confiance de 95 % : -89,0 à 106,9 minutes), une déviation du temps de sommeil REM de -18,7 minutes (IC 95 % : -130,9 à 93,6 minutes), et une déviation du temps de sommeil NREM de 27,6 minutes (IC 95 % : -100,6 à 155,8 minutes).

Pour la validation externe, la déviation du temps total de sommeil est de 34,7 minutes (IC 95 % : -37,8 à 107,2 minutes), celle du temps de sommeil REM est de -2,6 minutes (IC 95 % : -68,4 à 73,4 minutes), et celle du temps de sommeil NREM est de 32,1 minutes (IC 95 % : -54,4 à 118,5 minutes). Globalement, le modèle tend à sous-estimer les phases REM et les courtes durées de sommeil, tout en surestimant les phases NREM et les longues durées de sommeil.

Analyse des Données de la UK Biobank

Le classificateur de sommeil est appliqué à 100 000 participants de la UK Biobank pour explorer la relation entre la durée et l’efficacité du sommeil mesurées par dispositif avec la mortalité toutes causes confondues. Parmi les 66 214 participants, 1642 événements de décès sont observés. Les dormeurs à court terme ( heures) présentent un risque de mortalité plus élevé par rapport aux participants ayant une durée de sommeil normale (6 à 7.9 heures), que ce soit avec une faible (rapports de risque : 1.58 ; IC 95 % : 1.19 à 2.11) ou une grande efficacité du sommeil (rapports de risque : 1.45 ; IC 95 % : 1.16 à 1.81).

Résultats de l’Étude

L’étude révèle que les techniques de classification du sommeil basées sur le deep learning peuvent bien correspondre avec le PSG. Même avec des validations interne et externe distinctes, le modèle montre une certaine robustesse. Les données spécifiques indiquent qu’une courte durée de sommeil nocturne augmente le risque de mortalité toutes causes confondues pour les participants, indépendamment de la continuité du sommeil.

Paramètres de Sommeil et Relation avec la Mortalité

Sur une période de suivi de 452327 années, 1642 événements de décès sont observés. Les dormeurs à court terme ( heures) présentent un risque de mortalité plus élevé que les dormeurs normaux dans les groupes à faible (rapports de risque : 1.58 ; IC 95 % : 1.19 à 2.11) et grande efficacité de sommeil (rapports de risque : 1.45 ; IC 95 % : 1.16 à 1.82). Un risque de mortalité plus faible est observé avec une efficacité de sommeil plus élevée.

Discussion et Contributions

L’originalité de cette étude réside dans l’utilisation de données à grande échelle et multicentriques, et dans l’amélioration de la précision de la classification du sommeil par une combinaison de méthodes d’auto-apprentissage et de deep learning. Les résultats montrent que la courte durée de sommeil nocturne est associée à un risque de mortalité plus élevé, indépendamment de l’efficacité du sommeil. Pour les futures recherches, cette méthode et ces résultats ouvriront de nouvelles directions pour l’étude du sommeil et de la structure du sommeil à l’aide de bases de données d’accéléromètres à grande échelle.

À travers ces résultats, les chercheurs non seulement valident l’efficacité des modèles de deep learning pour la classification du sommeil, mais mettent également en lumière la relation évidente entre le sommeil nocturne court et la mortalité. Cette étude offre des outils et des preuves solides pour la surveillance du sommeil et la recherche sur les liens entre le sommeil et la santé.

Conclusion

Cet article développe et valide une méthode de deep learning en auto-apprentissage pour améliorer les techniques de classification du sommeil des accéléromètres, et valide cette méthode avec les données de grande échelle de la UK Biobank. L’étude met en évidence l’impact significatif de la courte durée de sommeil nocturne sur la santé, offrant des données fondamentales et un soutien méthodologique pour les recherches futures.

Détails de l’Étude et Outils

L’étude utilise un modèle de deep learning en auto-apprentissage (sleepnet), à travers l’auto-apprentissage de plusieurs tâches et le réseau récurrent (RNN) pour l’extraction et la classification des caractéristiques. Ces méthodes sont entraînées et validées sur les données de 70 millions d’individus-jours de la British Biobank. De plus, l’étude utilise un modèle de forêt aléatoire (Random Forest) pour l’identification de fenêtres dans les données de vie libre non étiquetées, améliorant ainsi la précision de la classification.

Les résultats de cette recherche jettent les bases de la surveillance et de l’analyse de la santé du sommeil à grande échelle, constituant une innovation à la fois pratique et efficace. L’algorithme et les paramètres du sommeil fournis par cette étude permettront de progresser dans la recherche sur la relation entre le sommeil, la structure du sommeil et les résultats de santé, apportant ainsi des bases scientifiques pour améliorer la santé de la population.