Développement et validation d'algorithmes d'apprentissage automatique basés sur des électrocardiogrammes pour les diagnostics cardiovasculaires au niveau de la population

Développement et validation d’un algorithme d’apprentissage automatique à grande échelle pour le diagnostic cardiovasculaire basé sur l’ECG

Introduction

Les maladies cardiovasculaires (Cardiovascular diseases, CV) constituent depuis longtemps une source majeure de charge de morbidité à l’échelle mondiale. Le diagnostic et l’intervention précoces sont essentiels pour réduire les complications de la maladie, l’utilisation des soins de santé et les coûts. L’électrocardiogramme (ECG) traditionnel, en tant qu’outil de diagnostic à faible coût et pratique, est largement utilisé pour la détection des maladies cardiovasculaires. Cependant, les techniques actuelles d’interprétation de l’ECG (y compris les algorithmes manuels et informatiques) présentent des limites dans l’identification des interactions de signaux de haut niveau et des modèles cliniquement pertinents “cachés”. L’émergence de l’intelligence artificielle (Artificial Intelligence, AI), en particulier de l’apprentissage profond (Deep Learning, DL), offre une nouvelle opportunité d’identifier les modèles “cachés” dans les signaux ECG et d’évaluer simultanément les interactions complexes entre diverses maladies cardiovasculaires. Cette étude est menée dans ce contexte.

Source et auteurs de l’article

Cet article a été publié dans le journal npj Digital Medicine. Il est le fruit de la collaboration de Sunil Vasu Kalmady, Amir Salimi, Weijie Sun, Nariman Sepehrvand, Yousef Nademi, Kevin Bainey, Justin Ezekowitz, Abram Hindle, Finlay McAlister, Russel Greiner, Roopinder Sandhu et Padma Kaul et de plusieurs institutions de recherche, en particulier à l’hôpital Bundang de l’Université Nationale de Séoul.

Conception de l’étude

Sujets de l’étude et collecte des données

Cette étude utilise les données ECG à 12 dérivations de 1 605 268 enregistrements fournies par 244 077 patients adultes fréquentant 84 services d’urgence ou hôpitaux en Alberta, Canada, entre février 2007 et avril 2020. L’objectif de la recherche est de prédire simultanément 15 diagnostics cardiovasculaires courants, y compris la fibrillation auriculaire, la tachycardie supraventriculaire, la tachycardie ventriculaire, l’arrêt cardiaque, le bloc auriculo-ventriculaire, l’angine instable, l’infarctus du myocarde avec élévation du segment ST, l’infarctus du myocarde sans élévation du segment ST, l’embolie pulmonaire, la cardiomyopathie hypertrophique, la sténose aortique, le prolapsus de la valve mitrale, la sténose mitrale, l’hypertension pulmonaire et l’insuffisance cardiaque.

Développement et validation du modèle

Deux approches différentes ont été utilisées pour prédire les maladies: un modèle d’apprentissage profond basé sur ResNet (utilisant les données de forme d’onde ECG) et un modèle d’extrême Gradient Boosting (XGB) (utilisant les données de mesure ECG), et l’évaluation des modèles a été effectuée sur un ensemble de test de 97 631 patients retenus.

Détail des processus opératoires

  1. Traitement initial des données : Les données ECG sont extraites des dossiers de santé des patients et associées à des bases de données administratives de santé standardisées.
  2. Entraînement des modèles : Les données ECG de 146 446 patients sont utilisées pour entraîner le modèle d’apprentissage profond et le modèle XGB.
  3. Évaluation de l’ensemble de rétention : La validation est réalisée sur l’échantillon de rétention de 97 631 patients, en comparant les performances du modèle sur le premier ECG de chaque patient.
  4. Analyse de l’importance des caractéristiques : La visualisation du modèle d’apprentissage profond est effectuée à l’aide de la méthode Grad-CAM, et l’analyse de l’importance des caractéristiques du modèle XGB est réalisée à l’aide du gain d’information.

Évaluation des performances

Les performances des modèles sur les 15 maladies cardiovasculaires sont évaluées dans l’ensemble de rétention, où le modèle DL a une aire sous la courbe ROC (AUROC) en moyenne supérieure d’environ 5% à celle du modèle XGB pour toutes les maladies, avec des améliorations significatives pour certains cas. Le modèle DL présente la meilleure performance pour la prédiction de l’infarctus du myocarde avec élévation du segment ST, avec une AUROC de 95,5%, tandis que la performance pour l’embolie pulmonaire est la plus faible, avec une AUROC de 68,9%.

Analyse par sexe et analyse des porteurs de pacemaker

L’étude évalue également les performances du modèle DL chez les hommes et les femmes, ainsi que chez les patients porteurs de pacemakers. Les résultats montrent des performances relativement cohérentes du modèle, avec de légères améliorations pour certaines maladies (par exemple, la tachycardie ventriculaire et l’infarctus du myocarde avec élévation du segment ST) chez les hommes. La présence de pacemakers n’affecte pas significativement les performances du modèle.

Résultats principaux

  1. Efficacité du modèle : Le modèle DL atteint une AUROC supérieure à 80% pour 12 des maladies cardiovasculaires, avec 4 maladies (y compris l’infarctus du myocarde avec élévation du segment ST, la sténose mitrale, la cardiomyopathie hypertrophique et le bloc auriculo-ventriculaire) ayant une AUROC supérieure à 90%.
  2. Amélioration des performances : Le modèle DL surpasse le modèle XGB pour la prédiction de la majorité des maladies, avec des améliorations significatives pour la détection de la sténose mitrale et de l’infarctus du myocarde.
  3. Robustesse du modèle : Les performances du modèle sont cohérentes entre les sexes et chez les patients porteurs de pacemakers, ce qui démontre la robustesse de l’algorithme.

Conclusion

Cette étude démontre l’efficacité et la robustesse des algorithmes ECG basés sur l’IA pour le diagnostic de 15 maladies cardiovasculaires, en particulier la supériorité du modèle DL par rapport au modèle XGB en termes de précision diagnostique. En exploitant une base de données administrative complète, la recherche montre le potentiel énorme des algorithmes d’apprentissage automatique pour le diagnostic des maladies cardiovasculaires courantes, fournissant ainsi de nouveaux outils pour le diagnostic précoce et la stratification des risques en pratique clinique. Des recherches supplémentaires sont nécessaires pour explorer le déploiement et l’efficacité de ces modèles dans les applications cliniques réelles.