Gène lié aux cellules T régulatrices dans la cholangite sclérosante primaire : preuves issues de la randomisation mendélienne et des données transcriptomiques

Contexte académique

La cholangite sclérosante primitive (Primary Sclerosing Cholangitis, PSC) est une maladie hépatique chronique et progressive, principalement causée par une combinaison de facteurs immunitaires, inflammatoires et génétiques, pouvant finalement conduire à une insuffisance hépatique. L’incidence et la prévalence de la PSC varient considérablement à l’échelle mondiale, allant de 0,07 cas pour 100 000 personnes par an en Espagne à 1,3 cas pour 100 000 personnes par an en Norvège, tandis que la prévalence varie de 0,2 cas pour 100 000 personnes en Espagne à 13,6 cas pour 100 000 personnes aux États-Unis. Environ 70 à 80 % des patients atteints de PSC souffrent également de maladie inflammatoire de l’intestin, ce qui augmente le risque de cholangiocarcinome et de cancer colorectal. Les manifestations cliniques et l’évolution de la PSC sont variées, et le diagnostic repose principalement sur l’imagerie des voies biliaires et l’histopathologie hépatique. Bien que certains patients aient une évolution plus indolente, le diagnostic de PSC a des implications significatives sur la santé à long terme, avec une survie médiane sans transplantation de 13,2 ans. Avec les progrès des techniques d’imagerie, des méthodes de diagnostic non invasives comme l’imagerie par résonance magnétique (IRM) ont progressivement remplacé des procédures invasives comme la cholangiopancréatographie rétrograde endoscopique (CPRE) et la biopsie hépatique pour une identification sûre et précise de la PSC. Cependant, il n’existe actuellement aucun médicament efficace pour traiter la PSC, et la transplantation hépatique reste le seul traitement efficace. Par conséquent, il est urgent de découvrir de nouveaux biomarqueurs pour optimiser les méthodes de diagnostic, déterminer les risques individualisés, identifier des cibles thérapeutiques et mieux comprendre les mécanismes physiopathologiques de la PSC.

Plusieurs théories existent sur l’étiologie de la PSC, mais la plus répandue suggère qu’il s’agit d’une maladie à médiation immunitaire déclenchée par un stimulus environnemental, conduisant finalement à des dommages hépatocytaires et à une inflammation chez les individus génétiquement prédisposés. Des études ont montré que l’infiltration de cellules immunitaires est significativement corrélée à la progression de la fibrose et aux dommages des cellules biliaires. Diverses cellules immunitaires, telles que les neutrophiles et les macrophages, ont été observées à proximité des voies biliaires chez les patients atteints de PSC. Une caractéristique distinctive de la PSC est l’infiltration de cellules T, bien que la composition et la fonction de ces cellules T infiltrantes varient. Par exemple, il a été observé que les cellules CD4+ T des patients atteints de PSC présentent une sensibilité réduite à l’apoptose, contrairement aux cellules CD8+ T. De plus, les patients atteints de PSC ont une proportion plus élevée de cellules CD8+ T positives pour CXCR3, mais une proportion réduite de cellules CD4+ T positives pour CD25. Cependant, ces études observationnelles peuvent être sujettes à des biais de causalité inverse et de confusion. Par conséquent, des essais contrôlés randomisés (ECR) sont nécessaires pour déterminer si le ciblage de cellules immunitaires spécifiques peut ouvrir de nouvelles voies thérapeutiques. En l’absence d’ECR, la randomisation mendélienne (Mendelian Randomization, MR) est devenue une technique importante pour évaluer les relations causales entre les expositions et les résultats cliniques en utilisant des variants génétiques comme variables instrumentales (IVs).

En outre, la recherche sur la PSC est limitée par plusieurs facteurs : la difficulté à obtenir des cellules biliaires, leur faible nombre dans le foie, l’instabilité des techniques de culture in vitro, et le fait que les échantillons proviennent souvent de patients à un stade avancé de la maladie. La disponibilité de données de séquençage RNA à haut débit offre une opportunité sans précédent pour découvrir de nouveaux biomarqueurs. Avec le développement de la bioinformatique, les méthodes d’apprentissage automatique sont devenues des outils courants pour la sélection de variables caractéristiques et la construction de modèles prédictifs. Actuellement, l’algorithme Lasso-Cox est la méthode principale pour générer des signatures prédictives à grande échelle, mais certaines méthodes de modélisation présentent des lacunes significatives, limitant leur application clinique. Ainsi, la découverte de nouveaux biomarqueurs pour la PSC en combinant des données transcriptomiques et des algorithmes d’apprentissage automatique avancés reste limitée.

Objectifs de l’étude

Cette étude vise à élucider le rôle clé du déséquilibre des proportions de cellules T régulatrices (Tregs) dans la survenue de la PSC en utilisant des données résumées d’études d’association pangénomique (GWAS) à grande échelle (731 sous-types de cellules immunitaires et trois ensembles de données GWAS sur la PSC), une méta-analyse et deux ensembles de données transcriptomiques sur la PSC. Ensuite, les chercheurs ont utilisé l’analyse de réseau de co-expression génique pondérée (WGCNA), l’analyse différentielle et 107 combinaisons de 12 algorithmes d’apprentissage automatique pour construire et valider un modèle de diagnostic basé sur l’intelligence artificielle (classificateur Tregs) avec une aire sous la courbe (AUC) moyenne de 0,959. Par la réaction en chaîne par polymérase quantitative en temps réel (qRT-PCR), il a été confirmé que, par rapport au groupe témoin, les niveaux d’expression de AKAP10, BASP1, DENND3, PLXNC1 et TMCO3 étaient significativement augmentés dans le modèle murin de PSC, tandis que les niveaux d’expression de KLF13 et SCAP étaient significativement réduits. De plus, l’analyse de l’infiltration des cellules immunitaires et de l’enrichissement fonctionnel a révélé des associations significatives entre les gènes centraux liés aux Tregs et les macrophages M2, les neutrophiles, les progéniteurs mégacaryocytes-érythroïdes (MEP), les cellules T tueuses naturelles (NKT), ainsi que les scores d’enrichissement de la mort cellulaire autophagique, des cascades du complément et de la coagulation, des perturbations métaboliques, de la phagocytose médiée par FcγR et du dysfonctionnement mitochondrial, pouvant potentiellement médier la survenue de la PSC. L’algorithme XGBoost et les explications additives de Shapley (SHAP) ont identifié AKAP10 et KLF13 comme des gènes optimaux, pouvant constituer des cibles thérapeutiques importantes pour la PSC.

Méthodes de recherche

Sources de données

Cette étude a utilisé trois ensembles de données GWAS à grande échelle sur la PSC (GWAS ID : ieu-a-1112, finn-b-k11_cholangi_strict, finn-b-k11_cholangi), provenant du projet IEU OpenGWAS. En outre, les chercheurs ont téléchargé deux ensembles de données d’expression d’ARNm de la PSC (GSE119600 et GSE159676) à partir de la base de données Gene Expression Omnibus (GEO). Les données résumées GWAS sur les phénotypes immunitaires proviennent du catalogue GWAS (numéros d’accession gcst90001391 à gcst90002121), comprenant 731 phénotypes immunitaires distincts, tels que les paramètres morphologiques (MP), les comptes cellulaires relatifs (RC), les comptes cellulaires absolus (AC) et les intensités de fluorescence médianes (MFI) exprimant les niveaux d’antigènes de surface.

Analyse de randomisation mendélienne

Les chercheurs ont d’abord déterminé les relations causales entre 731 types de cellules immunitaires et la PSC par analyse MR. Dans l’analyse MR, les variables instrumentales (IVs) sont des variations génétiques fortement associées à l’exposition et non confondues par d’autres facteurs influençant le résultat. Pour garantir la validité de l’étude MR, les IVs doivent satisfaire trois critères essentiels : (1) les SNPs significativement associés à l’exposition (p < 5 × 10^-8 ou p < 1 × 10^-5) sont utilisés comme IVs ; (2) hypothèse d’indépendance : les facteurs de confusion significatifs liés à l’exposition et au résultat ne sont pas associés aux SNPs (IVs) ; (3) hypothèse d’exclusivité : les SNPs (IVs) influencent le résultat directement via l’exposition et ne sont pas liés au résultat par d’autres voies.

Analyse des données transcriptomiques

Les chercheurs ont systématiquement recherché des ensembles de données transcriptomiques liés à la PSC dans la base de données GEO et ont sélectionné deux ensembles de données (GSE119600 et GSE159676) pour des analyses quantitatives et qualitatives. Grâce à l’analyse de réseau de co-expression génique pondérée (WGCNA), les chercheurs ont identifié des modules de gènes significativement associés à la proportion de Tregs. Ensuite, en utilisant l’analyse différentielle et des algorithmes d’apprentissage automatique, les chercheurs ont construit et validé un modèle de diagnostic basé sur des gènes liés aux Tregs.

Construction du modèle d’apprentissage automatique

Les chercheurs ont combiné 12 algorithmes classiques d’apprentissage automatique (tels que SVM, GBM, LDA, XGBoost, NaiveBayes, RF, etc.) et leurs 107 combinaisons pour construire un modèle de diagnostic consensuel. Par validation croisée à 5 plis, les chercheurs ont finalement sélectionné la combinaison Lasso+GBM comme modèle optimal, avec une AUC moyenne de 0,959 dans deux cohortes de PSC.

Validation par modèle animal

Les chercheurs ont utilisé un modèle murin de PSC induit par DDC pour valider les niveaux d’expression des gènes liés aux Tregs par qRT-PCR. Les résultats ont montré que, par rapport au groupe témoin, les niveaux d’expression de AKAP10, BASP1, DENND3, PLXNC1 et TMCO3 étaient significativement augmentés dans le modèle murin de PSC, tandis que les niveaux d’expression de KLF13 et SCAP étaient significativement réduits.

Résultats de la recherche

Résultats de l’analyse de randomisation mendélienne

Par analyse MR, les chercheurs ont découvert que l’augmentation de CD39+ Tregs au repos % CD4 Tregs était significativement associée à un risque accru de PSC, tandis que l’expression de CD3 sur les Tregs sécrétant CD39+ avait un effet protecteur contre la PSC.

Résultats de l’analyse des données transcriptomiques

Dans les ensembles de données GSE119600 et GSE159676, la proportion de Tregs était significativement plus élevée dans le groupe PSC que dans le groupe témoin. Par analyse WGCNA, les chercheurs ont identifié des modules de gènes significativement associés à la proportion de Tregs et ont ensuite filtré 65 gènes liés aux Tregs. En utilisant des algorithmes d’apprentissage automatique, les chercheurs ont finalement identifié 7 gènes centraux liés aux Tregs (AKAP10, BASP1, DENND3, PLXNC1, KLF13, SCAP et TMCO3) et ont construit un modèle de diagnostic basé sur ces gènes (classificateur Tregs).

Résultats de la validation par modèle animal

Dans le modèle murin de PSC, la qRT-PCR a validé les niveaux d’expression des 7 gènes centraux liés aux Tregs. Les résultats ont montré que, par rapport au groupe témoin, les niveaux d’expression de AKAP10, BASP1, DENND3, PLXNC1 et TMCO3 étaient significativement augmentés dans le modèle murin de PSC, tandis que les niveaux d’expression de KLF13 et SCAP étaient significativement réduits.

Analyse de l’infiltration des cellules immunitaires et de l’enrichissement fonctionnel

Par analyse de l’infiltration des cellules immunitaires, les chercheurs ont découvert que la proportion de neutrophiles et de cellules NKT était significativement augmentée chez les patients atteints de PSC, tandis que la proportion de macrophages M2 et de MEP était significativement réduite. L’analyse d’enrichissement fonctionnel a montré que la survenue de la PSC était étroitement liée à l’activation des voies immunitaires et inflammatoires (telles que les cascades du complément et de la coagulation, la phagocytose médiée par FcγR, etc.), tandis que les voies métaboliques (telles que le métabolisme des acides biliaires, le métabolisme du cholestérol, etc.) et les voies liées à la fonction mitochondriale étaient significativement réduites.

Conclusion de la recherche

Cette étude a intégré pour la première fois l’analyse MR et transcriptomique pour explorer les relations causales entre les Tregs et la PSC. En utilisant 107 combinaisons différentes d’algorithmes d’apprentissage automatique, les chercheurs ont construit et validé un modèle de diagnostic consensuel basé sur 7 gènes liés aux Tregs (classificateur Tregs). En outre, les chercheurs ont identifié les macrophages M2, les MEP, les perturbations métaboliques, les cascades du complément et de la coagulation, le dysfonctionnement mitochondrial ainsi que AKAP10 et KLF13 comme des cibles thérapeutiques potentielles pour la PSC, offrant de nouvelles perspectives sur les mécanismes sous-jacents de la maladie.

Points forts de la recherche

  1. Première intégration de l’analyse MR et transcriptomique : Cette étude est la première à explorer systématiquement les relations causales entre les Tregs et la PSC en utilisant l’analyse MR et des données transcriptomiques.
  2. Construction d’un modèle de diagnostic efficace : En utilisant 107 combinaisons d’algorithmes d’apprentissage automatique, les chercheurs ont construit un modèle de diagnostic basé sur des gènes liés aux Tregs avec une AUC de 0,959.
  3. Découverte de nouvelles cibles thérapeutiques : Les chercheurs ont identifié AKAP10 et KLF13 comme des cibles thérapeutiques potentielles pour la PSC et ont révélé leur rôle clé dans la survenue de la maladie.
  4. Éclaircissement des mécanismes immunitaires et métaboliques de la PSC : Par l’analyse de l’infiltration des cellules immunitaires et de l’enrichissement fonctionnel, les chercheurs ont mis en lumière les mécanismes immunitaires et métaboliques impliqués dans la survenue de la PSC, ouvrant de nouvelles voies pour le traitement.

Signification de la recherche

Cette étude fournit non seulement de nouveaux biomarqueurs pour le diagnostic précoce de la PSC, mais elle offre également une base théorique pour le développement de nouvelles stratégies thérapeutiques en révélant le rôle clé des gènes liés aux Tregs dans la survenue de la PSC. En outre, le classificateur Tregs construit par les chercheurs présente une valeur diagnostique élevée dans les applications cliniques, offrant une référence importante pour le traitement individualisé des patients atteints de PSC.