Utilisation de données fonctionnelles multiplexées pour réduire les inégalités de classification des variants dans les populations sous-représentées

Réduction des inégalités dans la classification des variantes chez les populations sous-représentées grâce à des données fonctionnelles multiplexées.

Références de l’article

Dawood et al., Genome Medicine (2024) 16:143. DOI : https://doi.org/10.1186/s13073-024-01392-7


Résumé du rapport

Introduction

Dans le domaine de la médecine génomique, une des problématiques majeures réside dans les disparités existant entre différentes populations en termes de classification des variantes génétiques. Les individus d’ascendance non européenne subissent souvent des biais dans le diagnostic des maladies génétiques, en raison d’une absence de données représentatives dans les bases de données génétiques. Cela conduit à : - Une sur-représentation de variantes « à signification incertaine » (VUS – Variants of Uncertain Significance) chez les individus non européens. - Une sous-classification des variantes dans les catégories « pathogène ou probablement pathogène » (P/LP – Pathogenic or Likely Pathogenic).

Hypothèse avancée : les « tests fonctionnels des effets de variants en multiplex » (MAVE – Multiplexed Assays of Variant Effects) peuvent être utilisés pour réduire ces disparités grâce à l’intégration de données fonctionnelles détaillées pour reclassifier les VUS des gènes d’intérêt dans des populations sous-représentées.


Méthodologie

1. Source des données et population étudiée

Les auteurs ont analysé les données génomiques de plusieurs grandes bases, incluant notamment : - All of Us (v7) : 245 394 individus. - gnomAD (Genome Aggregation Database) : Deux versions ont été utilisées avec 123 709 exomes pour gnomAD v2.1.1 et 51 535 génomes pour gnomAD v3.1.2 (non chevauchants avec la v2).

Les individus ont été regroupés en deux grandes catégories : - Ascendance européenne : 213 663 individus. - Ascendance non européenne : 206 975 individus (incluant des origines africaines/afro-américaines, latino-américaines, sud-asiatiques et est-asiatiques).

Des comparaisons des fréquences d’allèles classifiées dans ces populations ont été effectuées dans plusieurs spécialités médicales.

2. Méthodes d’analyse

  • Analyse statistique des disparités :

    • Test de Wilcoxon pour paires appariées : utilisé pour comparer la fréquence allélique de variantes entre populations d’ascendance européenne et non européenne.
    • Test du Chi² : pour déterminer si les variantes détectées sont exclusivement présentes dans une population spécifique.
  • Reclassification des VUS avec MAVE : Des données fonctionnelles MAVE ont été intégrées dans les lignes directrices des panels experts clinico-génomiques de ClinGen pour reclassifier les variants BRCA1, TP53 et PTEN.

  • Analyse des codes d’évidence essentiels : Pour chaque variante VUS reclassifiée, les chercheurs ont déterminé si l’élimination d’un code particulier régressait la reclassification à un statut « VUS ».


Résultats clés

1. Disparités dans la classification des variantes

  • Les individus non européens présentent une fréquence significativement plus élevée de VUS dans toutes les spécialités médicales et dans toutes les bases comparées (p ≤ 5,95e−06).
  • Les individus d’ascendance européenne ont plus fréquemment des variantes classées comme pathogènes ou probablement pathogènes (P/LP, p ≤ 2,5e−05). Cette différence est attribuée à une meilleure représentation des Européens dans les bases de données génétiques historiques.

2. Impact du MAVE sur la reclassification

  • Les données MAVE ont permis de reclassifier des VUS à un taux significativement plus élevé chez les individus non européens par rapport aux européens (p = 9,1e−03).

    • Parmi les 604 VUS analysés chez les individus d’ascendance non européenne :
    • 67,1 % ont été reclassifiés comme « probablement bénins »,
    • 8,9 % comme « bénins »,
    • 23,2 % sont restés VUS.
    • Pour les 480 VUS analysés chez les individus européens :
    • 65,6 % ont été reclassifiés comme « probablement bénins »,
    • 0,8 % comme « bénins »,
    • 30,2 % sont restés VUS.
  • Après reclassification, la disparité initiale entre les groupes disparaît pratiquement, aboutissant à des nombres comparables de VUS restants dans les deux populations.

3. Codes d’évidence : Impact inégalitaire des outils actuels

  • Les prédicteurs computationnels (e.g., PP3, BP4) et les codes de fréquence allélique (e.g., BS1, BA1) montrent un impact inéquitable entre les populations européennes et non européennes :
    • Les variantes dans les bases européennes bénéficient de meilleures annotations basé sur les prédictions computationnelles (p = 6,92e−05) et les fréquences alléliques (p = 7,47e−06).
    • Les codes issus de MAVE n’ont pas montré de biais, avec un impact équitable entre les deux groupes d’ascendance.

Discussion

1. Origines des disparités

Les inégalités dans la classification des variantes génétiques découlent principalement : - De données de séquençage historiquement biaisées vers des populations européennes ; - D’un manque de diversité dans les cohortes utilisées pour entraîner les modèles prédictifs computationnels.

Ainsi, les méthodes actuelles de prédiction des effets des variantes peuvent involontairement perpétuer des biais systématiques. Ces inégalités dans l’interprétation des variantes génétiques se traduisent par des diagnostics insuffisants ou inexacts pour les individus d’ascendance non européenne.

2. Apport des MAVE

Les analyses montrent que les données fonctionnelles MAVE : - Réduisent significativement les disparités représentées par les VUS, - Constituent un outil prometteur pour corriger les biais des prédicteurs computationnels et améliorer l’équité des classifications génétiques.

3. Limites et recommandations

  • Limitation méthodologique : Les catégories d’ascendance (européenne/non européenne) utilisées dans l’étude sont artificielles et ne reflètent pas la variation génétique continue au sein des populations humaines.
  • Améliorations nécessaires : Il est urgent de diversifier les bases de données génétiques via le séquençage de populations sous-représentées et de produire à grande échelle des données expérimentales comme celles générées par MAVE.

Conclusions

L’étude met en évidence des inégalités systémiques dans la classification des variantes génétiques entre les individus européens et non européens. L’intégration des données MAVE dans les évaluations cliniques constitue une solution prometteuse pour combler les lacunes dans les données génétiques.

Contributions principales :

  • Les MAVE réduisent efficacement les disparités entre européens et non européens dans la classification des VUS.
  • Elles offrent également des données uniformément réparties, qui peuvent servir à entraîner de nouvelles générations de prédicteurs computationnels plus justes.

Impact futur :

Les auteurs appellent à prioriser la génération de données saturées à travers des MAVE pour réduire l’augmentation des VUS à l’échelle globale. Cette approche expérimentale pourrait transformer la médecine génomique, en améliorant les résultats de santé équitables pour les populations historiquement marginalisées.