Décoder la biologie humaine et les maladies à l'aide des technologies de l'omics monocellulaire

Techniques d’omique unicellulaire pour décoder la biologie humaine et les maladies

Contexte

La cellule est l’unité fondamentale de la vie. Un seul ovule fécondé peut se développer en un corps humain complexe composé d’environ 37 000 milliards de cellules, organisées en divers tissus, organes et systèmes. Les méthodes traditionnelles de classification cellulaire reposent principalement sur la morphologie cellulaire, la localisation ou l’expression de quelques protéines, négligeant les différences moléculaires entre les cellules. L’hétérogénéité élevée des cellules détermine la diversité fonctionnelle de la biologie humaine. Non seulement l’état, la taille ou l’origine des cellules, mais aussi l’environnement spécifique et les interactions avec les cellules voisines ou distantes influencent les caractéristiques cellulaires. Les techniques de séquençage traditionnelles à grande échelle, comme le séquençage de l’ARN, masquent la diversité cellulaire en mesurant l’expression génique moyenne de toutes les cellules d’un échantillon expérimental. Par conséquent, il est crucial de comprendre la biologie humaine et les maladies à l’échelle unicellulaire.

Source de l’article

Cet article a été rédigé par des chercheurs de l’École des Sciences de la Vie de l’Université de Pékin (Biomedical Pioneering Innovation Center, School of Life Sciences, Peking University), notamment Qiang Shi, Xueyan Chen et Zemin Zhang. Il a été publié dans la revue “Genomics Proteomics & Bioinformatics” (2023) (DOI: 10.1016/j.gpb.2023.06.003). L’article résume principalement les derniers développements des techniques d’omique unicellulaire et leurs applications dans la recherche sur le cancer.

Développement des techniques d’omique unicellulaire

L’objectif du développement des techniques d’omique unicellulaire (Single-Cell Omics, SCO) est de déconstruire l’hétérogénéité cellulaire motivée par des programmes internes et des facteurs externes. Toutes les techniques SCO visent à décoder l’information autour de l’ADN, l’ARN et les protéines, qui sont au cœur du dogme central de la biologie moléculaire. Voici l’état de développement des techniques SCO à différents niveaux moléculaires :

Génome

Le séquençage du génome entier unicellulaire a réalisé des progrès importants dans la détection des variations génétiques telles que les variations nucléotidiques simples (SNVs), les petites insertions/délétions (Indels), les variations du nombre de copies (CNVs) et les variations structurelles (SVs). Ces variations, bien qu’apparaissant à faible fréquence, s’accumulent progressivement dans le développement, le vieillissement et la progression des maladies de plusieurs types de tissus humains. Les nouvelles méthodes comme “Smooth-Seq” excellent dans la détection des variations structurelles (SVs) et de l’ADN circulaire extrachromosomique (eccDNA).

Épigénétique

La régulation épigénétique (comme l’état de la chromatine, la conformation chromosomique et les modifications de l’ADN ou des histones) joue un rôle crucial dans les réseaux génétiques cellulaires à travers la corrélation entre l’information génétique et ses produits fonctionnels. Des techniques de mesure épigénétique au niveau unicellulaire ont été développées pour explorer l’accessibilité de la chromatine, la structure génomique tridimensionnelle et l’état de modification des histones.

Transcriptome

La technique scrRNA-seq a été largement appliquée, avec un faible coût et une facilité d’utilisation pour les non-spécialistes. Le séquençage du transcriptome excelle dans la commande cellulaire, l’état cellulaire et la classification des types cellulaires, capable de détecter des types cellulaires rares et de révéler les caractéristiques dynamiques des transitions du destin cellulaire.

Omique multimodale

Pour caractériser plus complètement les cellules individuelles, des techniques d’omique multimodale unicellulaire ont émergé, capables de mesurer simultanément plusieurs caractéristiques d’une seule cellule. L’application de la technologie CRISPR a rendu l’étude de l’association génotype-phénotype plus directe. Ces techniques ont grandement accéléré notre compréhension globale de la complexité des variations génétiques, de l’expression génique, des réseaux de régulation intracellulaires, de la communication intercellulaire et des effets environnementaux.

Analyse des données

En termes d’analyse des données, la grande quantité de données générées par les techniques SCO a stimulé le développement de méthodes computationnelles, créant une boucle de rétroaction positive. Par exemple, le flux d’analyse pour scrRNA-seq implique le prétraitement des données, le contrôle qualité, la normalisation, la sélection des gènes hautement variables (HVGs), la réduction de dimensionnalité, la visualisation et l’annotation automatique ou manuelle des types cellulaires. Les analyses avancées incluent l’analyse différentielle de la transcription et de la composition, l’inférence de trajectoire, la reconstruction des réseaux de régulation génique (GRNs), l’exploration des interactions intercellulaires, l’intégration multimodale, etc. La construction de grands ensembles de données atlas a également stimulé l’émergence de nouvelles méthodes d’annotation, telles que la méthode d’apprentissage par transfert basée sur l’apprentissage profond scBERT.

Applications de recherche

Étude de la complexité humaine

Le scrRNA-seq a été utilisé pour décrire les caractéristiques transcriptomiques de divers types et états cellulaires, par exemple dans l’étude du sang, du cerveau, du cœur, des reins humains, etc., révélant de nouveaux sous-groupes cellulaires et caractéristiques fonctionnelles. En particulier dans le domaine du cancer, les techniques SCO ont révélé la complexité du microenvironnement tumoral (TME), découvrant des cibles potentielles pour l’immunothérapie.

Analyse des maladies

Les applications SCO ciblées sur les maladies ont révélé de nombreuses caractéristiques pathologiques des tissus. Par exemple, les analyses unicellulaires de la sclérodermie, de la maladie de Crohn et du cancer du poumon ont révélé de nouveaux modules cellulaires pathologiques et des caractéristiques de régulation génique, fournissant de nouvelles orientations pour le diagnostic et le traitement des maladies. Pendant la pandémie de COVID-19, les techniques SCO ont aidé à identifier des anticorps neutralisants efficaces, démontrant leur immense potentiel dans la réponse aux maladies.

Recherche omique multimodale

L’omique multimodale intègre des données de plusieurs niveaux moléculaires, offrant une compréhension plus complète de l’hétérogénéité cellulaire et des caractéristiques dynamiques, comme le séquençage simultané du transcriptome et du protéome, du transcriptome et de l’épigénome, etc. Bien que des progrès significatifs aient été réalisés dans les techniques d’omique multimodale, le séquençage multimodal unicellulaire fait toujours face à de nombreux défis, tels que les problèmes de sensibilité de détection et de couverture. De plus, les études combinant des informations spatiotemporelles et des perturbations CRISPR favoriseront la compréhension des relations complexes entre génotype et phénotype.

Perspectives cliniques

Les techniques d’omique unicellulaire ont un vaste potentiel d’applications cliniques, notamment pour une classification plus précise des patients et des approches thérapeutiques plus personnalisées. Cependant, la réalisation de leur large application clinique nécessite de surmonter des obstacles tels que les coûts élevés et la complexité technique. L’automatisation et la simplification des flux d’analyse des données seront des étapes importantes pour pousser cette technologie vers une utilisation clinique pratique.

Résumé et perspectives

Les techniques d’omique unicellulaire représentent un immense potentiel pour la médecine de précision, fournissant de puissants outils pour la recherche en biologie humaine et sur les maladies. À l’avenir, avec les progrès continus de la technologie et l’élargissement de son champ d’application, les techniques SCO stimuleront une recherche systématique et complète du niveau cellulaire au niveau tissulaire, du génome à l’épigénétique, révélant les mécanismes profonds de la biologie humaine et des maladies. Finalement, ces avancées technologiques se traduiront par des services médicaux plus efficaces et de meilleurs résultats de traitement pour les patients.