Prédiction de l'efficacité de l'immunothérapie pour le cancer du poumon non à petites cellules en utilisant des réseaux de convolution graphique pondérés adaptatifs multi-vues

Prédiction de l’efficacité de l’immunothérapie pour le cancer du poumon non à petites cellules : Rapport de recherche sur le réseau de convolution graphique pondéré adaptatif multi-vues

Introduction générale

Le cancer du poumon est une tumeur maligne ayant un taux d’incidence extrêmement élevé et un pronostic défavorable, dont la létalité reste élevée depuis longtemps. Parmi tous les patients atteints de cancer du poumon, environ 85 % sont des cas de cancer du poumon non à petites cellules (Non-Small Cell Lung Cancer, NSCLC). En tant que méthode de traitement émergente, l’immunothérapie tumorale offre une nouvelle approche de traitement pour les patients atteints de cancer. Cependant, le coût de l’immunothérapie est élevé, et seulement environ 20 % à 50 % des patients peuvent obtenir des résultats satisfaisants grâce à cette thérapie. De plus, au cours du traitement, des effets secondaires tels que la pneumonie et l’hépatite immunitaires peuvent survenir. Par conséquent, il est crucial de prédire l’efficacité de l’immunothérapie avant que les patients ne soient traités.

Ces dernières années, la radiomique basée sur l’apprentissage automatique a montré un potentiel pour prédire l’efficacité de l’immunothérapie chez les patients atteints de NSCLC. Les caractéristiques radiomiques se sont avérées être des biomarqueurs de substitution efficaces pour prédire l’efficacité de l’immunothérapie. Cependant, la plupart des études ne considèrent que les caractéristiques radiomiques des patients individuels, ignorant les relations inter-patients. De plus, elles utilisent généralement différentes caractéristiques en série comme entrée d’un modèle à vue unique, sans prendre en compte la complexité des corrélations entre les différents types de caractéristiques.

Source de l’article

Cet article intitulé « Immunotherapy Efficacy Prediction for Non-Small Cell Lung Cancer Using Multi-View Adaptive Weighted Graph Convolutional Networks » a été rédigé par Qiong Wu, Jun Wang (membre de l’IEEE), Zongqiong Sun, Lei Xiao, Wenhao Ying et Jun Shi (membre de l’IEEE). Cet article a été publié dans le volume 27, n° 11 du journal « IEEE Journal of Biomedical and Health Informatics » en novembre 2023.

Processus de recherche

Origine des données et prétraitement

Le jeu de données utilisé dans cette étude contient les données de 107 patients atteints de NSCLC, recueillies rétrospectivement entre janvier 2018 et octobre 2020. Ces patients ont subi une tomographie par ordinateur (CT) trois jours avant de recevoir l’immunothérapie anti-programmed cell death-1 (anti-PD-1). L’évaluation de l’efficacité de l’immunothérapie a été effectuée selon les critères iRECIST (immédiatement) par des radiologues expérimentés, avec l’approbation éthique correspondante.

Extraction des caractéristiques radiomiques

En utilisant les directives de l’Image Biomarker Standardization Initiative (IBSI) et le package logiciel open-source Pyradiomics, diverses catégories de caractéristiques radiomiques ont été extraites des régions d’intérêt (ROIs) des images CT. Ces images ont été traitées par différents filtres tels que le filtre ondelettes, le carré, la racine carrée, le logarithme, l’exponentiel, le gradient et le filtre local binary pattern 2D (LBP2D), les caractéristiques étant regroupées en fonction du type de filtre de prétraitement d’image.

Construction de graphes multi-vues

Dans un environnement multi-vues, nous utilisons X_m pour représenter la matrice de caractéristiques dans la vue m, et A_m pour représenter la matrice d’adjacence dans la vue m. Basé sur les caractéristiques des patients Baseline (telles que l’âge, le type de pathologie et l’expression de PD-L1), la similarité entre les patients est calculée et les graphes multi-vues sont construits. Les méthodes et formules spécifiques de calcul de similarité sont comme suit :

A_m(i, j) = s(x_{i, m}, x_{j, m}) \sum_{k=1}^{k}J(p_i^(k), p_j^(k)),
s(x_i, x_j) = exp(-\frac{c^2(x_i, x_j)}{2\sigma^2}),
c(x_1, x_2) = 1 - \frac{cov(x_1, x_2)}{\sigma(x_1) \sigma(x_2)},
J(p_i^(k), p_j^(k)) = \left\{
    \begin{array}{ll}
        1 & \text{if } |p_i^(k) - p_j^(k)| < \tau \\
        0 & \text{otherwise}
    \end{array}
\right.

Méthode proposée : Réseau de Convolution Graphique Pondéré Adaptatif Multi-Vues (MVAW-GCN)

Structure du réseau

Nous proposons un Réseau de Convolution Graphique Pondéré Adaptatif Multi-Vues (MVAW-GCN) composé de trois canaux, chacun comprenant deux couches de convolution graphique et une couche de convolution graphique séparable, permettant de produire des embeddings partagés et spécifiques à la vue, fusionnés ensuite par une mécanisme de l’attention.

La formule de convolution graphique est :

H_m^(l) = ReLU(D_m^(∼) ^{-1/2}A_m^(∼) D_m^(∼)^{-1/2}H_m^{(l-1)}W_m^{(l)})

La formule de sortie de l’opération de convolution graphique séparable est :

H_m = ReLU(D_m^(∼) ^{-1/2}A_m^(∼) D_m^(∼)^{-1/2} H_m^{(l-1)} W_m^s) + ReLU(D_m^(∼) ^{-1/2}A_m^(∼) D_m^(∼)^{-1/2} H_m^{(l-1)} W_c)

Module de fusion des vues

Le module de fusion des vues attribue des poids adaptatifs à chaque vue en utilisant un mécanisme de l’attention. La formule spécifique du calcul de la valeur de l’attention est :

h̃_i,m = tanh(W_att h_i,m + b_att),
α_i,m = softmax(v^t h̃_i,m)

Les poids des vues sont :

h = ∑_m^M λ_m H_m

Fonction de perte

Prenant en compte les informations partagées et spécifiques à chaque vue, nous introduisons deux fonctions de perte : la perte de consistance (consistency loss, L_c) et la perte de diversité (diversity loss, L_d).

La perte de consistance :

L_c = \frac{1}{M} \sum_{m=1}^{M}||H_m^c - H^c||_F^2,
H^c = \frac{1}{M} \sum_{m=1}^{M} H_m^c

La perte de diversité :

L_d = \sum_{m_1=1}^{M}\sum_{m_2=1}^{m_2≠m_1}HSIC(H_m1^s, H_m2^s)

La fonction de perte finale :

L = L_p + β_1 L_c + β_2 L_d

Résultats

Nous avons validé la méthode proposée sur un jeu de données composé de 107 patients atteints de NSCLC, comprenant 52 patients ayant une réponse efficace et 55 patients ayant une réponse inefficace. Notre méthode a atteint une précision de 77,27 % et un AUC de 0,7780 pour la prédiction de l’efficacité, démontrant son efficacité dans la prédiction de l’immunothérapie pour le NSCLC.

  1. Comparaison de la précision : En utilisant les caractéristiques radiomiques de plusieurs vues, notre méthode montre une amélioration de la précision, de la sensibilité, de la spécificité et du score F1 par rapport aux méthodes utilisant une seule vue ou une simple concaténation de caractéristiques, mettant en avant l’avantage de l’apprentissage multi-vues.
  2. Analyse de l’efficacité de la fonction de perte : En tenant compte à la fois des pertes de consistance et de diversité, notre méthode atteint les meilleures performances en termes de précision et d’AUC, soulignant l’importance de considérer à la fois les informations partagées et spécifiques entre les vues.
  3. Efficacité du mécanisme de l’attention : Les expérimentations montrent que le mécanisme de l’attention peut ajuster dynamiquement les poids des différentes vues durant l’entraînement, rendant ainsi les résultats de classification plus précis.

Signification de la recherche

Notre méthode basée sur un Réseau de Convolution Graphique Pondéré Adaptatif Multi-Vues améliore significativement la précision de la prédiction de l’efficacité de l’immunothérapie pour le NSCLC en intégrant des informations d’images et non-images. Cette recherche non seulement propose de nouvelles approches pour l’application du machine learning et de la radiomique dans le domaine médical, mais offre également une référence importante pour la prise de décision clinique, permettant d’évaluer si un patient bénéficiera de l’immunothérapie avant le traitement et de réduire ainsi les coûts inutiles et les risques d’effets secondaires.

Perspectives futures

Bien que notre étude ait obtenu des résultats significatifs dans la prédiction de l’efficacité de l’immunothérapie pour le NSCLC, certaines limitations subsistent, telles que la taille de l’échantillon et l’utilisation de données monocentriques. Les recherches futures pourront inclure la collecte et la validation de données multicentriques, ainsi que l’étude plus approfondie de biomarqueurs plus complets, tels que l’expression de PD-L1.

Cette étude fournit un soutien théorique et expérimental solide à l’utilisation des réseaux de convolution graphique multi-vues pour la prédiction de l’efficacité de l’immunothérapie du NSCLC, jetant les bases de recherches futures dans ce domaine.