Un cadre d'adaptation de domaine de transport siamois pour la classification IRM 3D des gliomes et des maladies d'Alzheimer

Classification des Gliomes et de la Maladie d’Alzheimer sur des IRM 3D Basée sur le Cadre d’Adaptation de Domaine Siamese-Transport

Contexte de l’Étude

Dans le diagnostic assisté par ordinateur, le dépistage des images par résonance magnétique (IRM) 3D joue un rôle crucial dans le diagnostic précoce de diverses maladies cérébrales, permettant de prévenir efficacement l’aggravation de ces maladies. Les gliomes sont une tumeur cérébrale maligne courante et leur traitement varie en fonction du grade de la tumeur. Ainsi, une classification précise et efficace des IRM 3D est essentielle dans l’analyse des images médicales. Cependant, les modèles d’apprentissage profond traditionnels connaissent une dégradation significative lorsqu’ils sont appliqués à des données non étiquetées obtenues en clinique, principalement en raison de l’incohérence entre les domaines, telles que les différences entre les types d’équipements et les paramètres d’acquisition des données. Les méthodes actuelles se concentrent principalement sur la réduction des différences inter-domaines, mais négligent l’enchevêtrement des caractéristiques sémantiques et des informations de domaine.

Source de l’Article

Cet article a été rédigé par Luyue Yu, Ju Liu, Qiang Wu, Jing Wang, et Aixi Qu de l’Université de Shandong, et a été publié dans le numéro de janvier 2024 de la revue « IEEE Journal of Biomedical and Health Informatics ». L’article bénéficie du soutien de la Fondation des Sciences Naturelles de la Province du Shandong et des Projets Clés d’Innovation de la même province.

Méthode de Recherche

Flux de Travail Global

Les auteurs proposent un cadre d’adaptation de domaine basé sur Siamese-Transport (STDA), combinant la théorie du transport optimal et l’apprentissage par contraste pour la classification automatique de l’IRM 3D et la prédiction multi-niveaux des gliomes. La recherche comprend les étapes principales suivantes :

  1. Réseau Siamese-Transport : Conception d’un réseau de transport basé sur une structure siamoise, utilisant des paramètres de mise à jour croisée pour extraire des caractéristiques invariantes.
  2. Stratégie de Transport au Coût Optimal (OCTS) : Stratégie basée sur la distribution de la probabilité de distance, utilisée pour séparer les caractéristiques sémantiques et les informations de domaine dans l’espace de projection.
  3. Contraintes d’Invariance Mutuelle (MIC) : Utilisation de l’auto-entraînement par gradient mutuel dans l’espace de projection partagé pour contraindre davantage l’apprentissage inter-domaines.

Étapes et Détails Concrets

  1. Conception de l’Architecture du Réseau : Le cadre STDA utilise deux réseaux siamois de structure identique et partage les paramètres d’entraînement. Selon la tâche de classification, le réseau de base peut être n’importe quel réseau de neurones convolutifs profonds (comme ResNet ou VGG). Dans la propagation en avant, les deux réseaux partagent les paramètres d’entraînement ; dans la rétropropagation, les paramètres sont mis à jour à l’aide de l’algorithme de rétropropagation des gradients en fonction de la perte d’entropie croisée et de la fonction de perte de contraste.

  2. Mise à Jour de la Distribution des Caractéristiques : En utilisant OCTS, via la théorie du transport optimal, le coût de transport d’une distribution à une autre est calculé et l’invariance des caractéristiques de classification potentielles est atteinte en corrigeant et en mettant à jour collaborativement la cartographie des caractéristiques et la distribution des caractéristiques. Le processus d’optimisation de la cartographie des caractéristiques et de la mise à jour de la distribution est réalisé en entraînant le réseau d’extraction des caractéristiques et en minimisant la fonction de perte.

  3. Contraintes d’Invariance Mutuelle : Utilisation d’une méthode d’apprentissage auto-supervisé, en appliquant l’auto-entraînement par gradient mutuel pour contraindre l’invariance des caractéristiques des domaines source et cible dans l’espace de projection. L’opération stop-gradient est utilisée pour éviter le transfert de caractéristiques inefficaces entre différents domaines, stabilisant ainsi la représentation des caractéristiques pendant le processus d’entraînement.

Données et Conception Expérimentale

  1. Sources de Données :

    • Ensemble de données BRATS18 : Contient des scans IRM multimodaux de gliomes de haut grade (HGG) et de bas grade (LGG).
    • Ensemble de données TCGA-Brain : Extrait de « The Cancer Genome Atlas », contient des échantillons d’images de HGG et LGG.
    • Ensemble de données ADNI : Contient des images IRM structurelles de la maladie d’Alzheimer (AD) et de la cognition normale (NC).
    • Ensemble de données OASIS : Contient des échantillons de données AD et NC.
  2. Configuration Expérimentale :

    • Utilisation de VGG-16 comme réseau de base.
    • Pendant l’entraînement, l’algorithme de descente de gradient stochastique (SGD) est choisi pour l’optimisation.
    • Pour garantir une comparaison équitable, la stratégie d’entraînement et le calcul des modules de toutes les méthodes UDA sont les mêmes dans toutes les expériences.
  3. Comparaison Expérimentale :

    • Conception expérimentale comparant différentes méthodes UDA classiques, telles que Deep Coral, JAN et d’autres méthodes de pointe actuelles.
    • Expériences d’ablation effectuées pour valider l’efficacité des différents modules du réseau Siamese-Transport, de l’OCTS et du MIC.

Résultats de la Recherche

Expériences de Classification des Gliomes

Les résultats expérimentaux montrent que dans la tâche de classification binaire des gliomes, la méthode STDA obtient les meilleures performances. En particulier, dans différentes tâches de classification des gliomes, STDA dépasse les autres méthodes UDA en termes de précision de classification et de valeurs AUC, comme le montrent les tableaux 2 et 3.

Les expériences ont également révélé que même lorsque la différence de distribution entre le domaine source et le domaine cible n’est pas significative, les méthodes UDA peuvent toujours améliorer la précision de classification. Par exemple, l’utilisation de la méthode de transport optimal OTDA (sans le module Siamese-Transport) augmente la précision de 12,7 % sur un modèle sans apprentissage par transfert.

Expériences de Classification Multi-Niveaux des Gliomes

Dans les expériences de classification fine des gliomes multi-niveaux, la méthode STDA montre également les meilleures performances de classification. Comparée aux autres méthodes UDA, la précision est améliorée de 20,7 %, démontrant la capacité d’adaptation au domaine robuste de STDA dans des tâches complexes.

Expériences de Classification de la Maladie d’Alzheimer

Les résultats des expériences de classification de la maladie d’Alzheimer (tableau 4) montrent que la méthode STDA exhibe une forte capacité de généralisation sur différents ensembles de données d’images médicales publiques. Bien que la valeur AUC soit légèrement inférieure à celle de la méthode DAN en raison du déséquilibre des classes dans les ensembles de données, la précision de classification reste la plus élevée.

Analyse d’Ablation

  • Réseau Siamese-Transport : Les expériences d’ablation ont confirmé l’efficacité de l’architecture du réseau Siamese-Transport dans l’extraction des caractéristiques. STDA montre une capacité de représentation des caractéristiques plus stable pendant l’entraînement.
  • Stratégie de Transport au Coût Optimal : La méthode OCTS est significative pour la correction des distributions inter-domaines, réduisant nettement les différences de distribution entre domaines dans l’espace de caractéristiques de haute dimension.
  • Contraintes d’Invariance Mutuelle : Le module MIC stabilise davantage l’extraction des caractéristiques invariantes de la structure de double réseau pendant l’entraînement, améliorant ainsi la précision de classification.

Conclusion et Signification

Le cadre STDA proposé dans cet article améliore l’incohérence des distributions des caractéristiques et apprend des caractéristiques invariantes, résolvant efficacement le problème de la classification des IRM 3D de petits échantillons, et prouve son excellence dans les tâches de classification des gliomes et de la maladie d’Alzheimer. Le cadre STDA non seulement étend ses applications, mais peut également être utilisé pour l’apprentissage multi-tâches, tel que la prédiction de biomarqueurs tumoraux cérébraux et de cycles de survie, répondant aux besoins de l’apprentissage sur petits échantillons déséquilibrés. De futures recherches peuvent explorer des techniques d’augmentation de données plus optimisées, telles que l’apprentissage auto-supervisé et les réseaux antagonistes génératifs, pour améliorer davantage la stabilité et la précision de cette méthode.

Par cette recherche, nous étendons non seulement l’application des IRM 3D dans l’analyse des images médicales, mais nous fournissons également une méthode efficace pour résoudre le problème des différences inter-domaines, offrant ainsi un nouveau soutien technique au diagnostic et au traitement cliniques.