Estimation non supervisée de la précision pour les interfaces cerveau-ordinateur basée sur le décodage de l'attention auditive sélective

Estimation non supervisée de la précision des interfaces cerveau-ordinateur basées sur le décodage de l’attention auditive sélective

Contexte académique

Dans un environnement auditif complexe, les humains peuvent choisir de se concentrer sur une source sonore spécifique tout en ignorant d’autres sons perturbateurs. Ce phénomène est appelé “effet cocktail party” (cocktail party effect). La technologie de décodage de l’attention auditive sélective (Selective Auditory Attention Decoding, AAD) analyse des signaux cérébraux tels que l’électroencéphalographie (EEG) pour décoder la source sonore à laquelle un utilisateur prête attention. Cette technologie présente des applications importantes dans les aides auditives dirigées par le système nerveux (neuro-steered hearing aids) et les interfaces cerveau-ordinateur (Brain-Computer Interface, BCI). Cependant, les algorithmes AAD actuels reposent généralement sur l’apprentissage supervisé, nécessitant que l’utilisateur indique explicitement la source sonore à laquelle il prête attention afin de fournir des « étiquettes de vérité terrain » (ground-truth labels) pour l’entraînement. Dans des applications pratiques, l’obtention de ces vérités terrain est souvent difficile, surtout dans des scénarios où l’utilisateur ne peut pas coopérer (par exemple, chez des patients atteints de troubles de la conscience). De plus, l’absence de vérité terrain rend également difficile l’évaluation de la précision des algorithmes AAD.

Pour résoudre ces problèmes, cet article propose une méthode d’estimation de la précision AAD entièrement non supervisée. Cette méthode repose sur un modèle de modulation par déplacement de phase binaire (Binary Phase-Shift Keying, BPSK) issu des communications numériques, en considérant le système décisionnel AAD comme un canal avec bruit gaussien blanc additif (Additive White Gaussian Noise, AWGN), permettant ainsi d’estimer la précision des algorithmes AAD sans vérité terrain.

Origine de l’article

Cet article a été co-rédigé par Miguel A. Lopez-Gordo, Simon Geirnaert et Alexander Bertrand. Miguel A. Lopez-Gordo est affilié au département de théorie du signal, télématique et communications de l’université de Grenade (University of Granada) en Espagne, et est également membre du laboratoire de neuro-ingénierie et informatique (NECOLab) au centre de recherche en technologies de l’information et des communications (CITIC-UGR). Simon Geirnaert et Alexander Bertrand sont tous deux affiliés au département d’ingénierie électrique (ESAT) de l’université de Louvain (KU Leuven) en Belgique, rattachés au centre de systèmes dynamiques, traitement du signal et analyse de données (STADIUS) et à l’institut d’intelligence artificielle de Louvain (Leuven.ai). Simon Geirnaert est également affilié au groupe de recherche en neurosciences (EXPLORL) de l’université de Louvain. L’article a été publié en 2025 dans la revue IEEE Transactions on Biomedical Engineering.

Processus de recherche

1. Objectifs et méthodes de recherche

L’objectif principal de cette étude est de développer un algorithme d’estimation de la précision AAD entièrement non supervisé, applicable aux algorithmes AAD basés sur la corrélation dans des scénarios multi-parleurs. Cette méthode repose sur un modèle de communication BPSK, en considérant le système décisionnel AAD comme un canal avec bruit AWGN, et calcule le taux d’erreur binaire (Bit Error Rate, BER) pour estimer la précision AAD en estimant des paramètres tels que la différence des moyennes et l’écart-type.

2. Méthodologie et processus de recherche

2.1 Jeu de données et conception expérimentale

Le jeu de données utilisé dans cet article comprend des enregistrements EEG de 16 participants ayant une audition normale lors d’une tâche impliquant deux locuteurs, pour une durée totale de 72 minutes. L’expérience a été divisée en plusieurs essais, durant lesquels les participants devaient choisir de prêter attention à un locuteur provenant de la gauche ou de la droite tout en ignorant l’autre locuteur. Le jeu de données est disponible en ligne et contient une description détaillée de l’expérience.

2.2 Prétraitement vocal et EEG

Les signaux vocaux ont été décomposés à l’aide d’un banc de filtres Gammatone et les enveloppes sous-bandes ont été calculées via une fonction de loi de puissance, générant finalement des enveloppes auditives. Les données EEG et les enveloppes vocales ont été filtrées entre 1 et 9 Hz et sous-échantillonnées à 20 Hz.

2.3 Configuration et entraînement du décodeur

Cet article utilise un algorithme d’entraînement non supervisé pour entraîner le décodeur de stimulus (stimulus decoder), les coefficients initiaux du décodeur étant définis de manière aléatoire. La fenêtre d’intégration du décodeur a été fixée à 0-250 ms, avec 10 itérations. Pendant l’entraînement et les tests, des enveloppes vocales propres ont été utilisées.

2.4 Estimation de la précision non supervisée

L’algorithme d’estimation de la précision non supervisée proposé dans cet article repose sur un modèle BPSK pour estimer le BER, et donc la précision AAD, en estimant des paramètres tels que la différence des moyennes et l’écart-type. Les étapes spécifiques sont les suivantes : 1. Vérifier la normalité des coefficients de corrélation ; si l’hypothèse de normalité n’est pas satisfaite, appliquer une transformation de normalisation. 2. Calculer les paramètres pertinents (différence des moyennes et écart-type). 3. Utiliser la distribution normale pliée (folded normal distribution) pour estimer la différence des moyennes. 4. Calculer le BER et la précision.

3. Résultats expérimentaux

3.1 Validation des hypothèses

L’algorithme proposé dans cet article repose sur plusieurs hypothèses, y compris la normalité, la non-corrélation, l’égalité des variances, une différence des moyennes positive, et la stationnarité. Les résultats expérimentaux montrent que ces hypothèses sont valides dans la plupart des cas, soutenant ainsi l’efficacité de l’algorithme.

3.2 Résultats de l’estimation non supervisée de la précision

Les résultats expérimentaux montrent que l’algorithme d’estimation non supervisée de la précision proposé dans cet article peut estimer avec précision la précision des algorithmes AAD. Pour différentes quantités de données d’entraînement et longueurs de fenêtres décisionnelles, l’erreur d’estimation reste faible. Par exemple, pour une fenêtre décisionnelle de 20 secondes, l’erreur absolue moyenne n’est que de 3,1 points de pourcentage.

3.3 Scénarios d’application

La méthode d’estimation de la précision non supervisée proposée dans cet article présente de vastes perspectives d’application dans les aides auditives dirigées par le système nerveux et les interfaces cerveau-ordinateur. Par exemple, dans les aides auditives dirigées par le système nerveux, cette méthode peut prendre en charge le décodage adaptatif dans le temps, le contrôle dynamique du gain et le retour neuronal. Dans les interfaces cerveau-ordinateur, cette méthode peut fournir des retours précis aux soignants, soutenant ainsi des paradigmes de communication robustes.

Conclusion et signification

Cet article propose un algorithme d’estimation de la précision AAD non supervisée basé sur un modèle BPSK, capable d’estimer avec précision la précision des algorithmes AAD sans vérité terrain. Les résultats expérimentaux montrent que cette méthode fonctionne bien avec différentes quantités de données d’entraînement et longueurs de fenêtres décisionnelles, présentant une valeur scientifique et des perspectives d’application importantes. La recherche menée dans cet article fournit une nouvelle approche pour l’évaluation non supervisée des performances des systèmes AAD et pose les bases pour des applications pratiques dans les aides auditives dirigées par le système nerveux et les interfaces cerveau-ordinateur.

Points forts de la recherche

  1. Estimation de précision non supervisée : Cet article propose pour la première fois une méthode d’estimation de la précision AAD entièrement non supervisée, résolvant ainsi le problème de l’absence de vérité terrain.
  2. Innovation basée sur le modèle BPSK : En s’inspirant du modèle BPSK des communications numériques, cet article considère le système décisionnel AAD comme un canal avec bruit AWGN, permettant une estimation de la précision non supervisée.
  3. Perspectives d’application étendues : La méthode proposée dans cet article présente une grande valeur applicative dans les aides auditives dirigées par le système nerveux et les interfaces cerveau-ordinateur, prenant en charge des fonctions telles que le décodage adaptatif dans le temps, le contrôle dynamique du gain et le retour neuronal.

Autres informations utiles

La recherche menée dans cet article offre des références importantes pour l’optimisation future des systèmes AAD, par exemple en augmentant la différence des moyennes de corrélation pour améliorer les performances des décodeurs. De plus, la méthode d’estimation de la précision non supervisée proposée dans cet article peut également être étendue à des scénarios multi-parleurs, élargissant encore davantage son champ d’application.