Prédiction de l'origine tumorale dans les cancers d'origine primaire inconnue par l'apprentissage profond basé sur la cytologie
Introduction
Le cancer primitif inconnu (Cancer de Unknown Primary, CUP) est un type de maladie maligne confirmée par l’histopathologie mais dont le site primaire ne peut être identifié par les méthodes diagnostiques de routine. Le CUP représente un défi important en diagnostic et traitement clinique, représentant 3 à 5% de tous les cancers humains. Parmi eux, l’adénocarcinome est le type le plus courant, suivi par le carcinome épidermoïde et le cancer indifférencié. Malgré une série de traitements de chimiothérapie combinée, le pronostic global des patients reste très mauvais, seulement 20% des patients atteignant une survie médiane de 10 mois. Une caractéristique notable du CUP est sa présentation clinique de dissémination précoce, d’agressivité élevée et d’implication multi-organes.
Les tests d’immunohistochimie (Immunohistochemistry, IHC) sont couramment utilisés pour prédire le site primaire possible du CUP. Cependant, avec environ 20 combinaisons de différentes unités de coloration immunitaire, moins de 30% des cas de CUP peuvent être localisés précisément. Par conséquent, la prédiction précise du site primaire est cruciale pour un traitement efficace et personnalisé.
Source du document
Cet article a été rédigé par Fei Tian et al., avec des institutions affiliées telles que l’Institut de recherche sur le cancer et le premier hôpital affilié de l’Université médicale de Tianjin, le premier hôpital affilié à l’Université de Soochow, le premier hôpital affilié à l’Université de Zhengzhou et l’Université de Harvard aux États-Unis. Cette recherche a été soumise en mai 2023, acceptée en mars 2024 et publiée en ligne en avril 2024 dans « Nature Medicine ».
Objectif de l’étude
Cette étude vise à développer un modèle de prédiction du site primaire du cancer basé sur des images cytologiques en utilisant des méthodes d’apprentissage profond. Sur la base de l’analyse cytologique traditionnelle, l’équipe de recherche a développé un modèle d’apprentissage profond nommé TORCH (Tumor Origin Classification through Homeostasis) permettant le diagnostic et la prédiction du site primaire des tumeurs à partir de 57220 images cytologiques provenant de quatre hôpitaux de niveau tertiaire.
Processus de recherche
Collecte et traitement des données
Les recherches ont collecté 90572 images de cytologie sur lames provenant de 76183 patients dans quatre grands hôpitaux entre juin 2010 et octobre 2023. Après avoir exclu 24808 images malignes impossibles à localiser, le jeu de données final était constitué de 57220 images et de 43688 patients. Le jeu de formation comprenait 29883 images et 20638 patients couvrant 12 sous-types de tumeurs. Le jeu de formation contenait 19406 images de tumeurs et 10477 images de maladies bénignes. Trois hôpitaux, Tianjin, Zhengzhou et Soochow, ont contribué aux 12799 images du jeu de test interne, tandis que les hôpitaux de Tianjin et Yantai ont fourni les 14538 images du jeu de test externe.
Développement et validation du modèle
L’équipe a utilisé quatre réseaux neuronaux profonds différents sur trois types d’entrée, générant douze modèles différents (section Méthodes). Les résultats de ces modèles ont été intégrés pour améliorer la généralisation et l’interopérabilité du modèle. Le modèle TORCH a obtenu une moyenne de AUROC de 0,969 dans 27337 tests effectués sur trois jeux de test internes et deux jeux de test externes. Les valeurs AUROC étaient de 0,953, 0,962 et 0,979 pour les jeux internes, et de 0,958 et 0,978 pour les jeux externes.
Résultats expérimentaux
- Performance de diagnostic du cancer : Le modèle TORCH a obtenu une AUROC de 0,974, une précision de 92,6%, une sensibilité de 92,8% et une spécificité de 92,4% sur les cinq jeux de test.
- Performance de prédiction du site primaire des tumeurs : Une précision globale de 0,969 (95%CI: 0,967–0,970), une précision Top-1 de 82,6% et une précision Top-3 de 98,9%. Le modèle a atteint des AUROC de 0,930, 0,962 et 0,960, et des valeurs maximales de 0,799, 0,905 et 0,947.
- Comparaison avec les pathologistes : La performance prédictive de TORCH était nettement supérieure à celle des pathologistes, améliorant significativement la précision du diagnostic des pathologistes juniors.
- Analyse de survie : Les patients CUP recevant un traitement cohérent avec la prédiction de TORCH ont vécu plus longtemps que ceux recevant un traitement incohérent (27 mois contre 17 mois, p=0.006).
Conclusion de l’étude
Le modèle TORCH a montré un potentiel significatif en tant qu’outil d’assistance clé dans la pratique clinique, démontrant une application prometteuse dans le diagnostic du cancer et la localisation du site primaire à partir des images cytologiques. Bien que des essais randomisés futurs soient nécessaires pour une validation supplémentaire, cette étude fournit une base fiable pour la gestion clinique et le traitement personnalisé des patients CUP.
Points forts de l’étude
- Innovation et valeur applicative : La première utilisation de la technologie d’analyse d’image par apprentissage profond dans le contexte du diagnostic efficace du CUP, améliorant considérablement l’exactitude du diagnostic et de la prédiction.
- Grande quantité et couverture des données : L’utilisation d’un grand jeu de données d’images cytologiques provenant de quatre centres médicaux a amélioré la fiabilité et la généralisation des résultats.
- Assistance diagnostique intelligente : Le modèle TORCH aide les pathologistes juniors à atteindre une précision de diagnostic proche de celle des pathologistes seniors, réduisant le temps et les coûts du diagnostic.
- Allongement de la survie des patients : En pratique clinique, TORCH a amélioré la survie des patients, prouvant sa valeur en pratique clinique.
Directions de recherche future
Bien que le modèle TORCH ait montré des résultats initiaux prometteurs, les recherches futures pourraient envisager l’intégration de plus de types de données cliniques (tels que des données génomiques, des images radiologiques) pour améliorer davantage les performances du modèle. Il serait également important de vérifier sa généralisation auprès de populations de patients de différentes races et régions.
Conclusion
Cette étude a proposé et validé un modèle de prédiction du site primaire des tumeurs basé sur l’apprentissage profond, offrant de nouvelles perspectives et approches pour le diagnostic et le traitement du CUP, et fournissant un cas important pour l’application de l’intelligence artificielle dans le diagnostic médical.