基于选择性听觉注意力解码的无监督脑机接口准确度估计

基于选择性听觉注意解码的脑机接口无监督准确性估计研究

学术背景

在复杂的听觉环境中,人类能够选择性地关注某一个声音源,而忽略其他干扰声音,这一现象被称为“鸡尾酒会效应”(cocktail party effect)。选择性听觉注意解码(Selective Auditory Attention Decoding, AAD)技术通过分析脑电图(Electroencephalography, EEG)等脑信号,解码出用户正在关注的声音源。这一技术在神经导向助听器(neuro-steered hearing aids)和脑机接口(Brain-Computer Interface, BCI)等领域具有重要应用。然而,当前的AAD算法通常依赖于监督学习,即需要用户明确告知其关注的声音源,以提供“地面真值”(ground-truth labels)进行训练。在实际应用中,地面真值的获取往往困难,尤其是在用户无法配合的场景中(如意识障碍患者)。此外,缺乏地面真值也使得难以评估AAD算法的准确性。

为了解决这些问题,本文提出了一种完全无监督的AAD准确性估计方法。该方法基于数字通信中的二进制相移键控(Binary Phase-Shift Keying, BPSK)模型,将AAD决策系统视为带有加性高斯白噪声(Additive White Gaussian Noise, AWGN)的通信信道,从而在无需地面真值的情况下估计AAD算法的准确性。

论文来源

本文由Miguel A. Lopez-Gordo、Simon Geirnaert和Alexander Bertrand共同撰写。Miguel A. Lopez-Gordo来自西班牙格拉纳达大学(University of Granada)的信号理论、远程通信与通信系,同时也是信息与通信技术研究中心(CITIC-UGR)的神经工程与计算实验室(NECOLab)成员。Simon Geirnaert和Alexander Bertrand均来自比利时鲁汶大学(KU Leuven)的电气工程系(ESAT),隶属于动态系统、信号处理与数据分析中心(STADIUS)和鲁汶人工智能研究所(Leuven.ai)。Simon Geirnaert还隶属于鲁汶大学的神经科学研究组(EXPLORL)。本文于2025年发表在《IEEE Transactions on Biomedical Engineering》期刊上。

研究流程

1. 研究目标与方法

本文的研究目标是开发一种完全无监督的AAD准确性估计算法,适用于多说话者场景中的相关基AAD算法。该方法基于BPSK通信模型,将AAD决策系统视为带有AWGN的信道,并通过估计相关参数(如均值差和标准差)来计算误码率(Bit Error Rate, BER),从而估计AAD准确性。

2. 研究方法与流程

2.1 数据集与实验设计

本文使用的数据集包含16名正常听力参与者在双说话者任务中的EEG记录,总时长为72分钟。实验分为多个试验,参与者被要求选择性地关注来自左或右的说话者,同时忽略另一个说话者。数据集已在线公开,并包含详细的实验描述。

2.2 语音与EEG预处理

语音信号通过Gammatone滤波器组分解,并使用幂律函数计算子带包络,最终生成听觉包络。EEG数据和语音包络均经过1-9Hz的带通滤波,并降采样至20Hz。

2.3 解码器设置与训练

本文采用无监督训练算法训练刺激解码器(stimulus decoder),初始解码器系数设置为随机值。解码器的积分窗口设置为0-250ms,迭代次数为10次。训练和测试过程中使用干净的语音包络。

2.4 无监督准确性估计

本文提出的无监督准确性估计算法基于BPSK模型,通过估计相关参数(如均值差和标准差)来计算BER,从而估计AAD准确性。具体步骤如下: 1. 检查相关系数的正态性,若不满足正态性假设,则进行正态化变换。 2. 计算相关参数(如均值差和标准差)。 3. 使用折叠正态分布(folded normal distribution)估计均值差。 4. 计算BER和准确性。

3. 实验结果

3.1 假设验证

本文提出的算法基于多个假设,包括正态性、不相关性、方差相等、均值差大于零以及平稳性。实验结果表明,这些假设在大多数情况下成立,支持了算法的有效性。

3.2 无监督准确性估计结果

实验结果显示,本文提出的无监督准确性估计算法能够准确估计AAD算法的准确性。在不同训练数据量和决策窗口长度下,估计误差均保持在较低水平。例如,在20秒决策窗口下,平均绝对误差仅为3.1个百分点。

3.3 应用场景

本文提出的无监督准确性估计方法在神经导向助听器和脑机接口中具有广泛应用前景。例如,在神经导向助听器中,该方法可以支持时间自适应解码、动态增益控制和神经反馈。在脑机接口中,该方法可以为护理人员提供准确的反馈,支持稳健的通信范式。

结论与意义

本文提出了一种基于BPSK模型的无监督AAD准确性估计算法,能够在无需地面真值的情况下准确估计AAD算法的准确性。实验结果表明,该方法在不同训练数据量和决策窗口长度下均表现出色,具有重要的科学价值和应用前景。本文的研究为AAD系统的无监督性能评估提供了新的思路,并为神经导向助听器和脑机接口的实际应用奠定了基础。

研究亮点

  1. 无监督准确性估计:本文首次提出了一种完全无监督的AAD准确性估计方法,解决了地面真值缺失的问题。
  2. 基于BPSK模型的创新:本文借鉴数字通信中的BPSK模型,将AAD决策系统视为带有AWGN的信道,从而实现了无监督准确性估计。
  3. 广泛的应用前景:本文提出的方法在神经导向助听器和脑机接口中具有重要应用价值,支持时间自适应解码、动态增益控制和神经反馈等功能。

其他有价值的信息

本文的研究为未来的AAD系统优化提供了重要参考,例如通过增加相关均值差来提高解码器性能。此外,本文提出的无监督准确性估计方法还可以扩展到多说话者场景,进一步拓展其应用范围。