Modèle prédictif pour les alertes de risque quotidiennes chez les patients atteints de sepsis en unité de soins intensifs : visualisation et analyse clinique des indicateurs de risque
Le sepsis est un syndrome de réponse inflammatoire systémique déclenché par une infection, entraînant souvent une défaillance multiviscérale et un taux de mortalité élevé. Bien que les technologies médicales modernes aient fait des progrès significatifs dans le traitement du sepsis, certains patients décèdent encore en raison d’une détérioration rapide de leur état. Par conséquent, la prédiction précise du risque de mortalité des patients atteints de sepsis est cruciale pour permettre aux cliniciens de formuler des stratégies d’intervention personnalisées et opportunes. Cependant, les systèmes de score clinique existants (tels que APACHE-II et SOFA), bien qu’utiles pour évaluer l’état général des patients critiques, ne sont pas spécifiquement optimisés pour les patients atteints de sepsis. De plus, les modèles d’apprentissage automatique traditionnels, lorsqu’ils traitent des données séquentielles, négligent souvent les caractéristiques temporelles de la progression de la maladie, ce qui limite leurs performances prédictives.
Pour relever ces défis, cette étude propose un modèle de séries temporelles basé sur l’architecture Transformer, visant à capturer les trajectoires de santé dynamiques des patients pendant leur séjour en unité de soins intensifs (USI), afin d’identifier en temps réel les individus à haut risque et de fournir des insights exploitables pour des interventions personnalisées. Cette recherche améliore non seulement la précision de la prédiction du risque de mortalité des patients atteints de sepsis, mais offre également un nouveau paradigme pour l’évaluation pronostique en USI.
Source de l’article
Cet article a été co-écrit par Hao Yang, Jiaxi Li, Chi Zhang, Alejandro Pazos Sierra et Bairong Shen. Les auteurs sont respectivement affiliés au Centre d’Information de l’Hôpital de l’Ouest de l’Université du Sichuan, au Département d’Informatique et de Technologies de l’Information de l’Université de La Corogne en Espagne, au Département de Laboratoire Clinique de l’Hôpital Maternité et Enfance de Jinniu à Chengdu et à l’Institut de Médecine Intensive et de Génétique Systémique de l’Hôpital de l’Ouest de l’Université du Sichuan. L’article a été publié le 8 février 2025 dans la revue Precision Clinical Medicine, avec le DOI 10.1093/pcmedi/pbaf003.
Processus et détails de la recherche
1. Source des données et prétraitement
Les données de l’étude proviennent de la base de données collaborative eICU, qui contient des données cliniques de plus de 200 000 patients admis en USI dans 208 hôpitaux aux États-Unis. L’étude a inclus des patients diagnostiqués avec un sepsis, tout en excluant ceux de moins de 18 ans, ceux ayant passé moins de 24 heures en USI et ceux dont les données manquantes dépassaient 30 %. Au total, 13 610 patients ont été sélectionnés, dont 2 114 sont décédés pendant leur séjour en USI et 11 496 ont survécu.
Le prétraitement des données comprend les étapes suivantes : - Nettoyage des données : Les bibliothèques Python NumPy et Pandas ont été utilisées pour nettoyer et organiser les données. - Construction des séries temporelles : Les signes vitaux et les résultats de laboratoire enregistrés chaque heure ont été organisés chronologiquement selon la timeline d’admission en USI, formant une matrice de séries temporelles de 24×226. - Imputation des valeurs manquantes : Pour les données temporelles, la méthode d’imputation avant (Forward Imputation) a été utilisée ; pour les caractéristiques non temporelles, l’algorithme de forêt aléatoire a été appliqué.
2. Architecture et entraînement du modèle
L’étude propose une architecture Transformer en deux étapes, visant à capturer les modèles temporels horaires et quotidiens des patients. Les étapes spécifiques sont les suivantes : - Première étape : Encodeur Transformer horaire : Traite les données temporelles sur 24 heures chaque jour, capturant les dépendances intra-journalières via un mécanisme d’auto-attention, et utilise un pooling moyen pour générer une représentation quotidienne. - Deuxième étape : Encodeur Transformer quotidien : Traite les représentations quotidiennes sur 5 jours, capturant les dépendances inter-journalières via un mécanisme d’auto-attention. Pour les patients ayant passé moins de 5 jours en USI, un masquage (Masking) est appliqué pour gérer les données manquantes, assurant la cohérence des entrées du modèle.
Le modèle a été entraîné en utilisant le framework PyTorch sur un système d’exploitation Windows 11. Les ensembles d’entraînement, de validation et de test ont été répartis dans un ratio de 7:2:1. Pour gérer le déséquilibre des échantillons, la fonction de perte focale (Focal Loss) a été introduite.
3. Évaluation des performances du modèle
La généralisation du modèle a été évaluée via une validation externe : - Jeu de données chinois sur le sepsis : Le modèle a atteint une précision de 81,8 % avec une valeur AUC de 0,73. - Base de données MIMIC-IV-3.1 : Le modèle a atteint une précision de 76,56 % avec une valeur AUC de 0,84.
De plus, l’étude a comparé les performances du modèle à celles de modèles d’apprentissage automatique traditionnels (tels que l’arbre de décision, XGBoost, LSTM, etc.), montrant que le modèle Transformer en deux étapes surpassait significativement les autres modèles en termes d’AUC, de précision et de score F1.
4. Visualisation des caractéristiques et analyse clinique
L’étude a utilisé l’algorithme SHAP (SHapley Additive exPlanations) pour générer des cartes thermiques des poids des caractéristiques, révélant les dynamiques des caractéristiques associées à la mortalité. Par exemple, les niveaux de lactate, le volume courant, la concentration de chlorure et la glycémie étaient fortement corrélés à la mortalité des patients le premier jour d’admission. Au fur et à mesure de l’évolution de la maladie, la largeur de distribution des globules rouges (RDW), l’albumine, la phosphatase alcaline et les niveaux de calcium sont devenus des indicateurs prédictifs importants.
Conclusions et implications de la recherche
Cette étude a significativement amélioré la précision de la prédiction du risque de mortalité des patients atteints de sepsis en USI grâce à l’introduction d’un modèle de séries temporelles basé sur Transformer. Le modèle est capable de capturer les caractéristiques temporelles des changements de l’état des patients et de fournir des biomarqueurs cliniquement interprétables via la visualisation des caractéristiques. Ces découvertes offrent un nouvel outil pour l’évaluation pronostique en USI, aidant à optimiser les processus de triage, à réduire les retards de diagnostic et, finalement, à améliorer les résultats de survie des patients.
Points forts de la recherche
- Architecture de modèle innovante : Le modèle Transformer en deux étapes est appliqué pour la première fois à l’analyse des séries temporelles des patients atteints de sepsis en USI, capturant efficacement les changements dynamiques de l’état des patients.
- Haute performance prédictive : Le modèle a démontré une forte capacité de généralisation lors de la validation externe, atteignant une valeur AUC maximale de 0,92.
- Interprétabilité clinique : Les cartes thermiques des caractéristiques générées par l’algorithme SHAP fournissent aux cliniciens des indicateurs de risque intuitifs, facilitant l’élaboration de plans de traitement personnalisés.
- Large potentiel d’application : Ce modèle est non seulement applicable à l’évaluation pronostique des patients atteints de sepsis, mais peut également être étendu à la prédiction et à la gestion d’autres maladies critiques.
Autres informations utiles
L’équipe de recherche prévoit d’intégrer davantage de données en temps réel provenant des systèmes d’information hospitaliers et de développer des techniques d’apprentissage en ligne, permettant au modèle d’ajuster ses prédictions en fonction des retours cliniques. Cela fournira aux cliniciens un support décisionnel plus dynamique et précis.
Grâce à cette étude, nous constatons le potentiel immense de l’intelligence artificielle dans le domaine de la médecine intensive. À l’avenir, avec l’accumulation de davantage de données et l’optimisation des modèles, les modèles de prédiction basés sur les séries temporelles pourraient devenir un outil standard dans la gestion des patients en USI, contribuant de manière significative à l’amélioration de la qualité des soins et des taux de survie des patients.