Cartographie de la diversité des isoformes d'ARN médicalement pertinentes dans le cortex frontal humain âgé avec des séquençages d'ARN longitudinaux profonds

Contexte académique

L’épissage alternatif de l’ARN (isoformes d’ARN) joue un rôle crucial dans la régulation de l’expression génétique. En moyenne, les gènes codant pour des protéines chez l’homme contiennent plus de huit isoformes d’ARN, ce qui conduit à près de quatre séquences codant pour des protéines uniques. Les techniques de séquençage de courte lecture traditionnelles, en raison de leurs limitations de longueur de lecture, ne peuvent pas assembler et quantifier précisément les isoformes d’ARN, ce qui simplifie grandement la compréhension de la biologie fondamentale. De plus en plus de recherches montrent que différentes isoformes d’un même gène ont des réseaux d’interactions uniques au niveau des protéines. En particulier, des études ont montré que certaines isoformes d’un même gène peuvent avoir des fonctions complètement différentes, voire opposées, à l’intérieur de la cellule. Par exemple, le gène bcl-x, où bcl-xl a une fonction anti-apoptotique tandis que bcl-xs a une fonction pro-apoptotique. Ainsi, clarifier les fonctions des isoformes individuelles d’ARN est crucial pour comprendre les mécanismes des maladies et développer de nouvelles approches thérapeutiques.

Origine de la recherche

Cette étude a été réalisée conjointement par plusieurs scientifiques provenant de diverses institutions, notamment Bernardo Aguzzoli Heberle, J. Anthony Brandon, Madeline L. Page, etc., affiliés respectivement à l’Université du Kentucky, l’Université Emory, etc. L’article a été publié dans la revue Nature Biotechnology, avec le DOI https://doi.org/10.1038/s41587-024-02245-9.

Workflow de la recherche

L’objectif de cette étude était d’explorer la diversité des isoformes d’ARN des gènes liés à la santé dans le cortex préfrontal humain en utilisant des techniques de séquençage de longue lecture approfondie. Le workflow de la recherche se décompose en plusieurs phases :

Collecte et traitement des échantillons

Douze échantillons post-mortem du cortex préfrontal de personnes âgées ont été collectés, incluant six échantillons de maladie d’Alzheimer (MA) et six échantillons de contrôle. Chaque échantillon a été séquencé en utilisant un logement de flux Oxford Nanopore PromethION.

Extraction et séquençage de l’ARN

Le séquençage de l’ARNm enrichi en poly(A) a été réalisé en utilisant le kit PCR-cDNA d’Oxford Nanopore Technologies. Les données de séquençage ont été traitées avec le logiciel Guppy basecaller pour appeler les bases des fichiers .fast5 générés.

Analyse des données et quantification des isoformes d’ARN

Le logiciel Bambu a été utilisé pour quantifier les isoformes d’ARN et découvrir de nouveaux isoformes à partir des données de séquençage. Un total de 28 989 isoformes d’ARN a été identifié à partir des 12 échantillons, dont 20 183 ont été classifiés comme gènes codant pour des protéines et 2 303 comme ARN long non codant.

Validation au niveau des protéines

Pour valider les nouveaux isoformes d’ARN identifiés, nous avons utilisé des données de spectrométrie de masse existantes ainsi que celles d’autres études. Un petit nombre de nouveaux isoformes ont été validés avec succès au niveau des protéines.

Nouveaux isoformes et analyse d’expression différentielle

Un total de 1 534 nouveaux isoformes d’ARN a été découvert parmi les génomes nucléaires connus, dont 428 ont été classifiés comme nouveaux isoformes hautement fiables. Dans l’analyse d’expression différentielle, il a été trouvé que 99 isoformes avaient une expression différentielle entre les échantillons de MA et le groupe de contrôle. La majorité de ces isoformes sont issues de gènes sans expression différentielle au niveau des gènes.

Résultats de la recherche

Découverte de nouveaux isoformes d’ARN

Le logiciel Bambu a identifié un total de 1 534 nouveaux isoformes d’ARN dont 428 ont été classifiés comme hautement fiables après filtrage et validation. La plupart de ces nouveaux isoformes sont issus de gènes codant pour des protéines, présentant plus d’hétérogénéité dans les données de séquençage de longue lecture.

Isoformes différentiel d’expression de l’ARN

Entre les échantillons de maladie d’Alzheimer et le groupe de contrôle, nous avons trouvé 176 gènes avec une expression différentielle et 105 isoformes d’ARN à expression différentielle. Deux isoformes du gène tnfsf12 montraient des tendances d’expression opposées, soulignant l’importance d’analyser les isoformes au niveau différentiel pour les études de maladies.

Diversité des isoformes et pertinence clinique

L’étude a montré que 7042 gènes exprimaient deux ou plusieurs isoformes, et 1917 gènes liés à la médecine montraient une diversité d’isoformes. Ces découvertes soulignent la nécessité d’identifier les isoformes d’ARN individuels dans la recherche médicale et le diagnostic clinique.

Conclusion et signification de l’étude

Grâce au séquençage de longue lecture approfondie, l’étude a révélé la complexité de l’épissage alternatif de l’ARN dans le cortex préfrontal humain, en particulier parmi les gènes liés aux maladies. Cette découverte est non seulement significative pour la recherche scientifique fondamentale, mais fournit également de nouvelles idées pour le diagnostic clinique et le développement de thérapies. L’analyse de l’expression différentielle des isoformes a révélé des caractéristiques transcriptomiques liées aux maladies qui ne pourraient être découvertes au niveau génomique, démontrant encore plus l’importance du séquençage de longue lecture pour l’étude des maladies humaines complexes.

Points forts de l’étude

  1. Découverte de nouveaux isoformes: Cette étude a pour la première fois identifié 1 534 nouveaux isoformes à partir des échantillons de cortex préfrontal humain.
  2. Validation au niveau des protéines: Validation à l’aide de la spectrométrie de masse et d’autres données existantes pour plusieurs nouveaux isoformes au niveau des protéines.
  3. Analyse différentielle des isoformes: Analyse de l’expression différentielle des isoformes révélant des caractéristiques de maladies inobservables au niveau des gènes.
  4. Potentiel des technologies de séquençage longue lecture: L’étude montre que le séquençage longue lecture a un énorme potentiel pour explorer les mécanismes des maladies complexes et développer de nouvelles thérapies.

Informations supplémentaires

L’étude fournit une application web publique permettant de visualiser l’expression des isoformes d’ARN dans le cortex préfrontal de cerveaux âgés (https://ebbertlab.com/brain_rna_isoform_seq.html). Cela fournit un support puissant pour une analyse et une recherche approfondies.