Évaluation unifiée de la polarisation des cellules immunitaires à l'échelle d'une seule cellule
Les cellules immunitaires subissent un processus de polarisation induit par les cytokines en réponse à divers stimuli, ce qui modifie leurs profils transcriptionnels et leurs états fonctionnels. Ce processus dynamique joue un rôle central dans les réponses immunitaires, tant dans la santé que dans les maladies. Cependant, il manque actuellement une méthode systématique pour évaluer la polarisation induite par les cytokines dans les données de séquençage d’ARN monocellulaire (scRNA-seq). Pour combler cette lacune, les chercheurs ont développé la méthode Single-Cell Unified Polarization Assessment (SCUPA), la première méthode computationnelle pour évaluer de manière exhaustive la polarisation des cellules immunitaires.
Source de l’article
L’article a été co-écrit par Wendao Liu et Zhongming Zhao, respectivement affiliés au The University of Texas MD Anderson Cancer Center UTHealth Houston Graduate School of Biomedical Sciences et au Center for Precision Health, McWilliams School of Biomedical Informatics, The University of Texas Health Science Center at Houston. L’article a été publié le 25 février 2025 dans la revue Bioinformatics.
Processus de recherche
1. Collecte et prétraitement des données
Les chercheurs ont d’abord téléchargé le jeu de données scRNA-seq du Immune Dictionary (Dictionnaire Immunitaire) à partir du Single Cell Portal. Ce jeu de données contient les profils transcriptomiques monocellulaires des cellules immunitaires des ganglions lymphatiques de souris traitées avec 86 cytokines différentes. En outre, d’autres jeux de données ont été téléchargés à partir de SeuratData et de la base de données Gene Expression Omnibus (GEO), y compris un jeu de données de cellules mononucléées du sang périphérique humain (PBMC) traitées par IFN-β, un jeu de données de macrophages humains traités par cytokines, un jeu de données de rate de souris traitées par IL-2, ainsi qu’un jeu de données de cellules myéloïdes infiltrant les tumeurs dans divers cancers.
2. Génération des embeddings cellulaires et réduction de dimension
Les chercheurs ont utilisé le modèle de base monocellulaire Universal Cell Embeddings (UCE) pour générer des embeddings cellulaires pour tous les jeux de données scRNA-seq. Pour réduire la dimensionnalité, ils ont effectué une analyse en composantes principales (PCA) sur les embeddings cellulaires UCE et ont utilisé les 20 premières composantes principales comme caractéristiques d’entrée pour les modèles d’apprentissage automatique. De plus, des visualisations en 2D avec UMAP ont été générées pour la représentation des données.
3. Identification des cellules pleinement polarisées
Les chercheurs ont identifié les cellules pleinement polarisées pour chaque état de polarisation en fonction de trois critères : (1) les cellules proviennent d’un échantillon traité avec une cytokine spécifique ; (2) l’expression moyenne des gènes marqueurs de polarisation dans la cellule est supérieure à celle de la plupart des autres cellules ; (3) les embeddings cellulaires UCE de la cellule sont similaires à ceux d’autres cellules provenant d’échantillons traités avec la cytokine concernée. En calculant le “décalage d’embedding” et la similarité cosinus, les chercheurs ont sélectionné les cellules pleinement polarisées et les ont utilisées pour entraîner les modèles d’apprentissage automatique.
4. Entraînement et test des modèles d’apprentissage automatique
Les chercheurs ont testé plusieurs modèles d’apprentissage automatique, notamment la régression logique, les machines à vecteurs de support (SVM), les forêts aléatoires et une approche d’apprentissage semi-supervisé. Finalement, le modèle SVM a été choisi en raison de ses performances optimales pour tous les états de polarisation. Lors de l’entraînement, les cellules non polarisées étaient étiquetées 0, tandis que les cellules pleinement polarisées étaient étiquetées 1. Le modèle a été entraîné et testé 20 fois, avec des valeurs moyennes d’AUROC calculées.
5. Quantification de l’incertitude statistique
Étant donné que la polarisation des cellules immunitaires est un processus continu, les chercheurs ont utilisé la conformal prediction pour quantifier l’incertitude statistique dans l’évaluation de la polarisation. En calculant les scores de non-conformité (nonconformity scores), le modèle peut prédire pour chaque cellule si elle est polarisée, non polarisée, dans un état intermédiaire ou incertain.
6. Correction des effets de lot entre jeux de données
Pour améliorer la transférabilité de SCUPA à différents jeux de données, les chercheurs ont proposé une méthode simple et efficace de correction des effets de lot entre jeux de données. En ajustant les embeddings cellulaires UCE, le modèle peut contourner les processus complexes d’intégration des données tout en préservant les informations sur la polarisation.
7. Benchmarking des modèles de base monocellulaires
Les chercheurs ont comparé les performances des embeddings cellulaires générés par trois modèles de base monocellulaires (UCE, scGPT et scFoundation) pour prédire la polarisation des cellules immunitaires. Les résultats ont montré que les modèles UCE et scFoundation avaient des performances similaires, tandis que le modèle scGPT était moins performant.
Résultats principaux
1. Cadre de SCUPA et états de polarisation des cellules immunitaires
SCUPA utilise les états de polarisation des cellules immunitaires du Immune Dictionary comme référence pour entraîner des modèles d’apprentissage automatique afin de distinguer les cellules polarisées des échantillons traités par cytokines et les cellules non polarisées. En utilisant les embeddings cellulaires UCE, SCUPA parvient à capturer efficacement les cellules polarisées dans différentes espèces et conditions expérimentales.
2. Performance de SCUPA sur les jeux de données de stimulation par cytokines in vitro
Dans le jeu de données de PBMC humains traités par IFN-β, SCUPA a classifié avec précision les cellules stimulées et non stimulées, avec des valeurs d’AUROC supérieures à 0,99. Dans le jeu de données de macrophages humains traités par cytokines, SCUPA a identifié les états de polarisation induits par différentes cytokines et a révélé des corrélations entre ces états.
3. Application de SCUPA à un jeu de données de traitement par cytokines in vivo
Dans le jeu de données de rate de souris traitées par IL-2, SCUPA a révélé les états de polarisation induits par l’IL-2 et a montré que le traitement par IL-2 augmentait significativement la proportion de cellules polarisées.
4. Analyse des cellules myéloïdes infiltrant les tumeurs dans un jeu de données pan-cancéreux
SCUPA a révélé les états de polarisation et les réponses pro-inflammatoires des cellules myéloïdes dans différents types de cancer. Par exemple, les cellules myéloïdes dans le lymphome présentaient les scores de polarisation pro-inflammatoire les plus élevés, tandis que celles dans l’adénocarcinome pancréatique et le cancer du rein avaient des scores plus faibles.
Conclusion
SCUPA est la première méthode computationnelle pour évaluer de manière exhaustive la polarisation des cellules immunitaires, en utilisant les embeddings cellulaires du modèle de base monocellulaire UCE pour capturer les changements transcriptionnels associés à différents états de polarisation. La méthode a été validée avec précision sur plusieurs jeux de données indépendants et a révélé les caractéristiques de polarisation des cellules myéloïdes infiltrant les tumeurs dans différents cancers. SCUPA fournit un nouvel outil pour l’étude de la polarisation des cellules immunitaires, avec un potentiel important dans le domaine des thérapies basées sur les cytokines.
Points forts de la recherche
- Première méthode systématique pour évaluer la polarisation des cellules immunitaires : SCUPA comble une lacune dans l’évaluation de la polarisation induite par les cytokines dans les données scRNA-seq.
- Utilisation du modèle de base monocellulaire UCE : En utilisant les embeddings cellulaires UCE, SCUPA parvient à capturer les cellules polarisées dans différentes espèces et conditions expérimentales.
- Validation sur plusieurs jeux de données indépendants : SCUPA a montré des performances exceptionnelles dans les jeux de données in vitro et in vivo, en classifiant avec précision les cellules polarisées.
- Révélation des caractéristiques de polarisation des cellules myéloïdes infiltrant les tumeurs : SCUPA a mis en évidence les états de polarisation et les réponses pro-inflammatoires dans différents types de cancer.
Autres informations utiles
Le code de SCUPA est disponible publiquement sur GitHub (https://github.com/bsml320/scupa), permettant aux chercheurs de l’utiliser et de l’étendre librement. De plus, SCUPA est conçu pour s’intégrer facilement au pipeline Seurat, largement utilisé, facilitant ainsi l’analyse complète des données monocellulaires.