Réseau Résiduel-Dense pour la Prévision du Glaucome en Utilisant les Caractéristiques Structurelles de la Tête du Nerf Optique

Prédiction du glaucome basée sur les caractéristiques structurelles de la tête du nerf optique à l’aide du réseau dense résiduel (RD-Net)

Contexte et objectifs de l’étude

Le glaucome est l’une des principales causes de cécité dans le monde, souvent désignée comme le “voleur silencieux de la vision”. Sa caractéristique principale est une dégradation progressive du nerf optique (Optic Nerve Head, ONH), qui peut entraîner une perte de vision irréversible avant même que le patient ne s’en rende compte. Statistiquement, le glaucome est la deuxième cause principale de cécité après la cataracte. Le dépistage précoce et le diagnostic précis sont essentiels pour gérer la progression de cette maladie et préserver la vision des patients.

En clinique, le diagnostic de glaucome repose principalement sur les tests structurels et fonctionnels suivants : mesure de la pression intraoculaire (Intraocular Pressure, IOP), évaluation structurelle de la tête du nerf optique, et champ visuel. Cependant, le champ visuel nécessite des appareils coûteux, ce qui limite son utilisation dans les centres de santé primaires. Par conséquent, l’analyse des caractéristiques structurelles de l’ONH comme le ratio cup-disc (Cup-to-Disc Ratio, CDR), l’échelle de probabilité de dommages au disque (Disc Damage Likelihood Scale, DDLS) et la règle ISNT (Inferior, Superior, Nasal, Temporal pour la largeur de la bordure) permet un dépistage rapide et efficace dès les premiers stades.

Bien que de nombreux algorithmes aient tenté de détecter les lésions de l’ONH par des méthodes automatisées, ceux-ci s’appuient souvent uniquement sur le CDR en ignorant d’autres caractéristiques anatomiques importantes. Par ailleurs, l’évaluation manuelle des ONH peut être longue, coûteuse et sujette à des erreurs subjectives. Ainsi, les chercheurs ont développé un modèle hybride basé sur l’apprentissage profond, nommé Réseau Dense Résiduel (Residual Dense Network, RD-Net), pour segmenter avec précision le disque optique (Optic Disc, OD) et la cupule optique (Optic Cup, OC) afin de prédire le glaucome.

Source de l’article

Cette recherche a été réalisée par Preity, Ashish Kumar Bhandari, Akanksha Jha et Syed Shahnawazuddin, affiliés au Département de Génie Électronique et Communication de l’Institut National de Technologie de Patna, Inde. L’article a été publié dans le numéro de janvier 2025 de la revue IEEE Transactions on Artificial Intelligence, volume 6, numéro 1. Les expériences menées sur quatre bases de données de référence (Drishti, RIMONE, ORIGA et REFUGE) illustrent l’efficacité du modèle proposé.

Méthodologie et étapes

Vue d’ensemble du processus

L’étude est divisée en trois étapes principales : 1. Prétraitement des images : incluant l’augmentation des données et le codage des étiquettes. 2. Construction et entraînement du modèle RD-Net : intégration de modules supplémentaires au modèle U-Net standard. 3. Extraction de caractéristiques et prédiction du glaucome : calcul des indices CDR, DDLS et ISNT à partir des résultats de segmentation de RD-Net.

1. Prétraitement des images

Étant donné la rareté des bases de données d’images rétiniennes pour le glaucome, des techniques d’augmentation des données ont été employées avec la bibliothèque Albumentation, permettant des transformations variées comme rotations aléatoires, flips, transformations élastiques, distorsions optiques ou mise à l’échelle standard à 256×256 pixels. Cette augmentation a permis de multiplier le volume d’exemples (par exemple, le jeu d’entraînement de Drishti est passé de 30 à 300 images).

2. Architecture du RD-Net

RD-Net est un réseau profond hybride basé sur U-Net, enrichi avec des blocs résiduels denses (Dense Residual Block) et des blocs d’excitation compressée (Squeeze-Excitation Block, SE Block). Les détails incluent 18 couches convolutives, 4 couches de pooling maximum et des connexions de saut (Skip Connections) entre l’encodeur et le décodeur. L’architecture est composée de deux parties :

  • Partie encodeur : elle comporte cinq niveaux, chacun comprenant une convolution, une normalisation par lot (Batch Normalization), une activation non linéaire (ReLU), et des blocs résiduels denses. Chaque étape est suivie d’un pooling maximum pour extraire des caractéristiques clés tout en réduisant la résolution spatiale.
  • Partie décodeur : elle comporte quatre niveaux d’échantillonnage ascendant (Upsampling). Les connexions de saut permettent de combiner les sorties des niveaux correspondants entre l’encodeur et le décodeur, restituant progressivement la résolution originale. Le dernier niveau comprend un bloc SE et une couche convolutive 1×1 pour produire la segmentation finale.

Le modèle utilise l’optimiseur Adam avec un taux d’apprentissage initial de 0,001, et He Initialization pour l’initialisation des poids. Un mécanisme Dropout (taux de 0,2) est incorporé pour régulariser et éviter le surapprentissage.

3. Extraction de caractéristiques et prédiction

Trois caractéristiques structurelles clés sont extraites des cartes de segmentation : - Calcul du CDR : ratio de la hauteur verticale de la cupule à celle du disque optique (considéré comme un indice précoce du glaucome). - Calcul du DDLS : rapport entre la plus petite bordure du disque et son diamètre. Une valeur inférieure à 0,3 est associée à des lésions glaucomateuses. - Règle ISNT : la séquence normale des largeurs des bordures est inférieure (Inferior) < supérieure (Superior) < nasale (Nasal) < temporale (Temporal). Toute déviation peut signaler une pathologie.

Ces caractéristiques permettent finalement de classer les cas suspects de glaucome.

Jeux de données et configurations expérimentales

Quatre bases de données publiques ont été utilisées : - Drishti : contient 101 images de fonds d’œil avec des annotations pour le disque et la cupule. - RIMONE-DL : inclut 485 images (annotées par des experts). - ORIGA : comporte 650 images avec des masques combinés pour OD et OC. - REFUGE : une base de données pour un défi sur le glaucome, comprenant 400 images.

Les expériences ont été exécutées sur un GPU NVIDIA Tesla T4, avec TensorFlow.

Résultats et analyses

Analyse qualitative

Lors des expériences sur les quatre bases de données, RD-Net a produit des résultats de segmentation avec des frontières claires et peu d’artefacts. Les résultats visuels, comparés à des modèles comme U-Net ou U-Net++, montrent que RD-Net fournit des cartes plus nettes, même dans des cas complexes (images complètes ou segmentées par région).

Pour les bases de données ORIGA et REFUGE, comportant des annotations combinées pour OD et OC, RD-Net a également démontré une performance cohérente en segmentation conjointe.

Analyse quantitative

Sept métriques standard ont été utilisées pour l’évaluation, incluant le coefficient de Dice (DC), le ratio d’intersection sur union (IoU) et l’exactitude (Accuracy). Par rapport à d’autres méthodes (U-Net, ResUNet, clustering K-means), RD-Net a atteint des précisions segmentant OD et OC avec respectivement 99,40 % et 98,94 %. Les tests croisés ont également confirmé la robustesse du modèle.

Études d’ablation et analyse de la complexité

Les effets des blocs résiduels et SE ont été validés par ablation. Par exemple, la suppression du bloc SE a réduit significativement la qualité de la segmentation (Dice abaissé à 0,91 sur Drishti). Bien que le modèle soit légèrement plus complexe, il surpasse largement ses prédécesseurs.

Évaluation du glaucome

Les prédictions de glaucome ont été effectuées avec précision en combinant la règle ISNT, le DDLS et les valeurs de CDR dérivées des résultats de segmentation. Des analyses de cas, comme des mesures des segments pour des yeux glaucomateux et non glaucomateux, illustrent la fiabilité de l’approche.

Importance et perspectives

Le modèle RD-Net offre non seulement une segmentation précise de OD et OC, mais améliore également considérablement le dépistage et le diagnostic précoces du glaucome. En contexte médical à faibles ressources, il peut réduire les coûts et augmenter l’efficacité.

Les travaux futurs incluront : 1. Développement d’un système de gradation de la gravité du glaucome ; 2. Applications élargies pour d’autres pathologies rétiniennes (ex. : rétinopathie diabétique).

En combinant les modules d’apprentissage profond avancés, RD-Net constitue un outil essentiel pour l’analyse des images ophtalmiques, promettant une contribution importante à la santé publique et à l’ophtalmologie.