Apprentissage Fédéré Semi-Supervisé Model-Hétérogène pour la Segmentation d'Images Médicales

Modèle Hétérogène de Fédération Apprentissage Semi-Supervisé pour la Segmentation d’Images Médicales

Introduction

La segmentation des images médicales joue un rôle crucial dans le diagnostic clinique en aidant les médecins à identifier et analyser les pathologies. Cependant, cette tâche est souvent confrontée à des défis tels que les données sensibles, les questions de confidentialité et les coûts élevés d’annotation. Bien que les recherches actuelles se concentrent principalement sur la formation collaborative personnalisée des systèmes de segmentation médicale, elles négligent que l’obtention des annotations de segmentation est longue et laborieuse. Comment équilibrer les coûts d’annotation et la performance de segmentation tout en maintenant la personnalisation du modèle local est devenu un enjeu crucial. Par conséquent, cette recherche introduit un nouveau cadre de fédération apprentissage semi-supervisé (HSSF) pour les modèles hétérogènes.

Architecture d’apprentissage fédératif de l’hétérogénéité des modèles

Provenance du Papier

Cet article, intitulé “Model-Heterogeneous Semi-Supervised Federated Learning for Medical Image Segmentation”, a été coécrit par Yuxi Ma, Jiacheng Wang, Jing Yang, et Liansheng Wang. Les auteurs appartiennent respectivement à l’Institut National des Sciences des Données et de la Médecine de Santé de l’Université de Xiamen et au Département d’Informatique de l’Université de Xiamen. Le papier a été publié dans le journal IEEE Transactions on Medical Imaging en mai 2024.

Méthodologie de Recherche et Processus

Flux de Travail

  1. Objectif de Recherche : Le principal objectif de cette étude est de proposer un cadre HSSF qui réduit le fardeau d’annotation en utilisant des données non annotées tout en maintenant la personnalisation du modèle.

  2. Modules Clés : Le cadre HSSF introduit la condensation de régularité et la fusion de régularité pour assurer la personnalisation entre les différents sites. En outre, les modules d’auto-évaluation (SA) et de génération de pseudo-étiquettes fiables (RPG) sont proposés pour exploiter pleinement les données non annotées.

  3. Condensation et Fusion de Régularité :

    • Condensation de Régularité : Le serveur sélectionne les règles les plus proches de la vérité parmi les modèles soumis par différents sites et les diffuse à tous les sites.
    • Fusion de Régularité : Chaque site fusionne sélectivement certaines règles utiles en fonction de ses besoins.
  4. Apprentissage Semi-Supervisé :

    • Module SA génère en temps réel des scores de confiance auto-évalués pour détecter la précision des prédictions du modèle.
    • Module RPG produit des pseudo-étiquettes fiables basées sur les scores de confiance du SA. Ces deux modules combinés améliorent l’efficacité de la formation avec des données non annotées.

Conception Expérimentale

Nous avons évalué le modèle sur des ensembles de données de lésions de la peau et de polypes, démontrant que le modèle HSSF surpasse d’autres méthodes tant dans les conceptions hétérogènes que dans les conceptions homogènes, en particulier dans les mesures d’évaluation régionale.

Détails de l’Algorithme

Le flux de travail du HSSF se compose des étapes suivantes :

  1. Préparation des Données : Préparation d’un ensemble de données public et de plusieurs ensembles de données locaux. L’ensemble de données public est utilisé pour partager les connaissances, tandis que les ensembles de données locaux restent privés pour les opérations locales.
  2. Condensation de Régularité : À chaque cycle de communication, le serveur sélectionne d’abord les règles optimales parmi tous les modèles locaux.
  3. Mise à Jour du Modèle Local : Chaque site fusionne ces règles de manière sélective en fonction de ses besoins et utilise les données locales non annotées pour se former et mettre à jour son propre modèle.

Méthodes Spécifiques d’Apprentissage Semi-Supervisé

  1. Apprentissage Supervisé : Pré-formation sur l’ensemble de données public pour former le modèle et le module SA afin qu’ils puissent générer efficacement des scores de confiance.
  2. Auto-formation Non Annotée : Les scores de confiance générés par le module SA sont utilisés pour corriger les pseudo-étiquettes, améliorant ainsi leur fiabilité. L’auto-formation et la régularisation de la consistance sont ensuite appliquées aux données locales non annotées.

Résultats de la Recherche

  1. Mesures d’Évaluation : Les coefficients de Dice et la distance de Hausdorff ont été utilisés comme principales mesures d’évaluation pour quantifier la performance de la segmentation du modèle. Les résultats montrent que le HSSF obtient des performances excellentes dans tous les cas considérés.

  2. Comparaison Expérimentale : Le HSSF a été comparé avec d’autres méthodes avancées d’apprentissage fédéré pour les modèles homogènes et hétérogènes, confirmant son efficacité et sa supériorité.

  3. Expériences d’Ablation : Des expériences d’ablation ont été conduites pour valider l’efficacité de chaque module, prouvant que les modules SA et RPG améliorent significativement les performances du modèle dans différents contextes.

Conclusion de la Recherche

Le cadre HSSF proposé dans cette étude a démontré des performances supérieures pour les tâches de segmentation d’images médicales. En introduisant les modules SA et RPG, le modèle peut s’auto-évaluer et corriger les pseudo-étiquettes, augmentant l’efficacité de l’utilisation des données non annotées. De plus, les mécanismes uniques de condensation et fusion de régularité du HSSF garantissent la personnalisation des modèles à chaque site, réalisant ainsi un partage de connaissances efficace dans l’apprentissage fédéré. En réduisant le fardeau d’annotation, en protégeant la confidentialité des données et en améliorant la personnalisation des modèles, ce cadre présente un potentiel et une valeur élevés pour des applications pratiques dans le futur de l’apprentissage collaboratif inter-sites.