Réseau de supervision bilatérale pour la segmentation d'images médicales semi-supervisée
Contexte et Motivation de la Recherche
La segmentation des images médicales revêt une importance capitale dans l’analyse des structures anatomiques et des zones de lésions, ainsi que dans le diagnostic clinique. Cependant, les méthodes d’apprentissage supervisé existantes reposent sur une grande quantité de données annotées, alors que l’obtention de données annotées au niveau des pixels pour les images médicales est coûteuse et chronophage. Afin de réduire la dépendance à ces données annotées, les méthodes d’apprentissage semi-supervisé (SSL) ont progressivement émergé. Bien que les méthodes SSL existantes, telles que le cadre mean teacher (MT), aient obtenu de bons résultats, elles présentent encore de nombreuses limites. Par conséquent, cette étude propose un réseau de supervision bilatérale (bilateral supervision network, BSNet) pour mieux exploiter les échantillons non annotés et améliorer les performances de la segmentation des images médicales en mode semi-supervisé.
Source de l’article
Cet article a été rédigé par Along He, Tao Li, Juncheng Yan, Kai Wang et Huazhu Fu. Les auteurs sont respectivement issus du Key Laboratory of Network and Data Security Technology de l’Université de Tianjin, de la School of Computer Science de l’Université de Nankai, du Haihe Laboratory of iTAI, de l’Institute of High Performance Computing (IHPC) de Singapour, et de l’Agency for Science, Technology and Research (A*STAR). Cet article a été publié dans le numéro de mai 2024 du IEEE Transactions on Medical Imaging, volume 43, numéro 5.
Processus de Recherche
Le réseau de supervision bilatérale proposé, BSNet, inclut les étapes clés suivantes :
a) Détail du Processus de Recherche
Conception de l’architecture réseau :
- BSNet est composé de deux réseaux de segmentation identiques, fa et fb, qui peuvent être formés avec des données annotées pour calibrer les biais de poids. De plus, une mise à jour par moyenne exponentielle bilatérale (bilateral-EMA) est utilisée pour les poids, permettant aux deux réseaux d’apprendre l’un de l’autre.
- Un discriminateur léger (fd) est également conçu pour l’apprentissage adversarial, afin d’améliorer la fiabilité des étiquettes fausses.
Mise à jour par moyenne exponentielle bilatérale (bilateral-EMA) :
- Dans le cadre MT original, seule la mise à jour EMA du modèle étudiant vers le modèle enseignant est considérée, ce qui crée un goulot d’étranglement dans l’entraînement. BSNet améliore cette limitation avec une EMA bilatérale entre fa et fb, permettant aux poids d’être calibrés sur des données annotées, renforçant ainsi la capacité d’apprentissage du modèle.
Supervision bilatérale :
- Supervision bilatérale des deux réseaux de segmentation à l’aide des étiquettes fausses. Ces étiquettes sont générées par chaque réseau et servent à superviser l’autre, maximisant ainsi l’utilisation des informations de classe dans les données non annotées et augmentant la fiabilité des résultats de segmentation.
Apprentissage adversarial :
- En utilisant le mécanisme GAN, fd sert de discriminateur pour distinguer les étiquettes fausses des vraies, visant à rendre les étiquettes fausses plus proches de la distribution des étiquettes vraies, améliorant ainsi la qualité de la supervision des données non annotées.
b) Principaux Résultats de l’Étude
Les expériences menées sur plusieurs ensembles de données de segmentation d’images médicales montrent que BSNet présente des performances exceptionnelles dans les tâches de segmentation semi-supervisée. Les résultats expérimentaux spécifiques incluent :
Résultats sur un ensemble de données de lésions cutanées :
- Avec seulement 1⁄9 des données annotées (100 images annotées et 800 images non annotées), BSNet obtient une amélioration significative des scores Dice et IoU par rapport à Unet et d’autres méthodes SOTA, atteignant des performances proches de celles du Unet totalement supervisé.
Résultats sur un ensemble de données de segmentation de polypes gastro-intestinaux :
- Dans la tâche complexe de segmentation de polypes sur fonds variés, BSNet surpasse les autres méthodes SOTA grâce à l’EMA bilatérale et à la stratégie d’apprentissage adversarial.
Résultats sur un ensemble de données de segmentation des vaisseaux rétiniens :
- BSNet excelle en matière de scores IoU et Dice, dans la segmentation des petits vaisseaux, tirant parti de faibles quantités d’échantillons d’entraînement.
Résultats sur un ensemble de données d’IRM de la prostate :
- Sur l’ensemble de données Promise12, BSNet montre une amélioration notable des indicateurs Dice et ASSD par rapport aux méthodes SOTA existantes.
Résultats sur un ensemble de données de segmentation de l’oreillette gauche :
- Sur l’ensemble de données Left Atrium MRI, BSNet obtient les meilleures performances dans tous les indicateurs d’évaluation, validant son efficacité.
c) Conclusions et Valeur de la Recherche
BSNet résout efficacement les limitations de la méthode MT en utilisant des stratégies de supervision bilatérale et d’apprentissage adversarial, améliorant considérablement les performances de la segmentation semi-supervisée des images médicales. Ces résultats montrent que BSNet est non seulement performant sur des images médicales en 2D, mais aussi en segmentation 3D. La méthode offre une valeur appliquée importante, notamment dans les cas où les données annotées sont rares, réduisant de manière significative la dépendance à des volumes importants de données annotées.
d) Points Forts de la Recherche
- Points innovants : La stratégie de supervision bilatérale et le mécanisme d’apprentissage adversarial proposés résolvent efficacement le goulot d’étranglement de performance causé par MT.
- Preuves expérimentales : Les résultats expérimentaux exhaustifs sur différents ensembles de données prouvent la supériorité de BSNet.
- Applicabilité : La méthode convient non seulement aux tâches de segmentation de grandes lésions, mais aussi à celles des petits vaisseaux, démontrant une grande universalité.
e) Autres Informations Utiles
Les expériences menées sur différents réseaux de segmentation (comme Unet++ et Attention Unet) et différentes backbones (comme ResNet50, ResNet101 et les architectures basées sur les transformers) montrent que BSNet offre une bonne performance de généralisation. De plus, l’analyse de sensibilité des valeurs initiales des coefficients de perte confirme la robustesse et la stabilité de BSNet.
Travaux futurs
À l’avenir, il sera possible de concevoir des algorithmes d’apprentissage semi-supervisé encore plus efficaces, exploitant mieux les données non étiquetées inter-tâches pour améliorer les performances SSL. De plus, étant donné que les CNN manquent de relations de dépendance à longue portée entre les pixels, combiner les caractéristiques globales des modèles transformers pourrait permettre de mieux traiter les tâches complexes de segmentation des lésions.