Apprentissage semi-supervisé informé par les connaissances anatomiques orales pour la segmentation 3D des CBCT dentaires et la détection des lésions
Contexte académique et motivation de la recherche
Dans le domaine des soins dentaires, la tomodensitométrie à faisceau conique (CBCT, Cone Beam Computed Tomography) est une technique d’imagerie tridimensionnelle largement utilisée. Le CBCT permet de fournir des images 3D de la cavité buccale, en particulier pour le diagnostic des lésions d’origine dentaire. Cependant, la segmentation des images CBCT – c’est-à-dire l’étiquetage des lésions, des os, des dents et des matériaux de restauration pour chaque voxel (volume élémentaire) – est une tâche cruciale et complexe. Actuellement, la pratique clinique repose principalement sur la segmentation manuelle, qui non seulement prend du temps, mais nécessite également une expertise considérable. Pour automatiser la segmentation et réduire la dépendance à une grande quantité de données annotées manuellement, les chercheurs ont proposé une méthode d’apprentissage semi-supervisé intégrant des connaissances anatomiques orales. Cet article propose un nouveau modèle appelé “OAK-SSL” (Oral-Anatomical Knowledge-Informed Semi-Supervised Learning) pour la segmentation d’images 3D CBCT et la détection des lésions.
Origine de l’article
Cet article a été co-écrit par Yeonju Lee, Min Gu Kwak, Rui Qi Chen, Hao Yan, Muralidhar Mupparapu, Fleming Lure, Frank C. Setzer et Jing Li. Les auteurs sont affiliés à des institutions telles que le Georgia Institute of Technology, l’Arizona State University, l’University of Pennsylvania et MS Technologies Corporation. L’article a été publié dans IEEE Transactions on Automation Science and Engineering et a bénéficié du soutien de la subvention NIH Grant DE031485.
Processus de recherche
1. Problème et défis
Le principal défi de l’automatisation de la segmentation des images CBCT est de réduire la dépendance à une grande quantité de données annotées manuellement. Les méthodes de segmentation existantes nécessitent généralement des données annotées en masse, ce qui est non seulement chronophage, mais peut également entraîner des inconsistances entre les observateurs. Pour résoudre ce problème, les chercheurs ont proposé le modèle OAK-SSL, qui intègre des connaissances anatomiques orales pour améliorer la précision de la segmentation des petites lésions, en particulier lorsque les données annotées sont limitées.
2. Conception du modèle OAK-SSL
La particularité du modèle OAK-SSL réside dans la transformation des connaissances anatomiques orales qualitatives en représentations quantitatives, qui sont ensuite intégrées dans un cadre d’apprentissage profond. Plus précisément, le modèle comprend trois éléments clés :
- Transformation des connaissances en représentation quantitative : La connaissance qualitative selon laquelle “les lésions périapicales (periapical lesions) doivent être proches des racines dentaires” est transformée en une carte de distance (distance map), quantifiant la distance de chaque voxel à la racine dentaire la plus proche.
- Architecture d’apprentissage double tâche guidée par les connaissances : Le modèle effectue simultanément une tâche de segmentation et une tâche de prédiction de distance, cette dernière aidant le modèle à se concentrer sur les emplacements anatomiquement plausibles des lésions.
- Fonction de perte semi-supervisée guidée par les connaissances : Pour les images non annotées, le modèle utilise une combinaison de perte de confiance et de perte de stabilité pour exploiter les connaissances anatomiques, améliorant ainsi la précision de la segmentation des lésions.
3. Jeu de données et prétraitement
L’étude utilise un jeu de données de 145 images CBCT 3D fournies par la School of Dental Medicine de l’Université de Pennsylvanie. Les images ont une résolution de 341×341×341 voxels, et toutes les images contiennent au moins une racine dentaire avec une lésion. Les échantillons ont été divisés en un groupe “petites lésions” et un groupe “lésions régulières” pour vérifier les performances du modèle dans la segmentation des petites lésions. L’ensemble d’entraînement comprend 20 échantillons annotés et 80 échantillons non annotés, tandis que l’ensemble de test comprend 30 échantillons annotés.
4. Expériences et résultats
L’étude compare OAK-SSL à plusieurs méthodes existantes (y compris des méthodes d’apprentissage supervisé et semi-supervisé), en utilisant des métriques telles que le score de Dice (Dice score) et la précision de détection des lésions (detection accuracy). OAK-SSL a démontré des performances supérieures dans toutes les tâches de segmentation, en particulier dans la segmentation des petites lésions. Plus précisément :
- Score de Dice : Le score de Dice d’OAK-SSL pour la segmentation des lésions est de 0,647, significativement supérieur à celui d’autres méthodes (par exemple, 0,215 pour l’apprentissage supervisé).
- Précision de détection des lésions : La précision (precision) et le rappel (recall) d’OAK-SSL sont respectivement de 0,791 et 0,933, montrant son excellence dans la réduction des faux positifs (false positives) et des faux négatifs (false negatives).
5. Études d’ablation
Pour vérifier l’efficacité de chaque module d’OAK-SSL, des études d’ablation (ablation study) ont été menées. Les résultats montrent que :
- Utilisation des données non annotées : Lorsque les données non annotées sont supprimées, le score de Dice pour la segmentation des lésions chute de 0,647 à 0,301, confirmant l’importance des données non annotées.
- Pondération guidée par les connaissances : Lorsque les pondérations guidées par les connaissances dans la tâche de prédiction de distance sont supprimées, le score de Dice pour la segmentation des lésions passe de 0,647 à 0,805, démontrant le rôle clé de ces pondérations dans l’amélioration des performances du modèle.
Conclusion et valeur
Le modèle OAK-SSL, en intégrant des connaissances anatomiques orales, améliore significativement la précision de la segmentation des images CBCT 3D, en particulier pour les petites lésions. Ce modèle réduit non seulement la dépendance à une grande quantité de données annotées manuellement, mais améliore également l’efficacité et la fiabilité du processus de segmentation grâce à l’automatisation. Les recherches futures pourraient étendre l’application des connaissances anatomiques du modèle, par exemple en intégrant des informations sur la forme et la taille des lésions, ainsi qu’en distinguant différents types de lésions périapicales pour améliorer la précision du diagnostic et de la planification du traitement.
Points forts de la recherche
- Innovation : Première transformation des connaissances anatomiques orales en représentations quantitatives, intégrées avec succès dans un modèle d’apprentissage profond.
- Pratique : Réduction significative de la dépendance à une grande quantité de données annotées manuellement, améliorant l’efficacité et la précision de la segmentation.
- Valeur clinique : Capacité à détecter et segmenter efficacement les petites lésions à un stade précoce, offrant un soutien important pour le diagnostic et le traitement cliniques.
Autres informations utiles
Le modèle OAK-SSL utilise également la technique de visualisation Grad-CAM (Gradient-weighted Class Activation Mapping) pour montrer le processus de prise de décision du modèle dans la segmentation des lésions. Les résultats montrent qu’OAK-SSL peut se concentrer plus précisément sur les zones réelles des lésions, évitant les faux positifs courants avec d’autres méthodes.