基于微状态和递归量化分析的GRU-CNN模型在听觉注意力检测中的应用

综述与报道:基于微状态和递归量化分析的GRU-CNN模型在听觉注意力检测中的应用

背景与研究动机

注意力作为一种认知能力,对感知过程起着至关重要的作用,帮助人类在纷繁复杂的环境中集中注意力于特定对象,而忽略其他干扰。本论文针对听觉注意力检测(Auditory Attention Detection,AAD)进行了研究,通过多通道脑电图(EEG)信号在听者专注于目标讲话者的过程中提取不同的动态特征,以期在存在竞争性讲话者的情况下有效检测听觉注意力。

论文来源与作者信息

此论文由Mohammadreza Eskandarinasab、Zahra Raeisi、Reza Ahmadi Lashaki和Hamidreza Najafi撰写,分别来自于犹他州立大学、费尔莱狄克森大学、德黑兰科技大学等机构。该论文发表于2024年,刊登在《Scientific Reports》期刊上,DOI为:10.1038/s41598-024-58886-y。

研究流程与细节

a) 研究流程详细描述

数据集与预处理

研究使用了两个公开数据库:DTU数据库和KUL数据库,分别包含44名和16名正常及听力受损的受试者的EEG信号。DTU数据库包含耳EEG和64通道EEG信号,分别采样频率为512 Hz,而KUL数据库使用64通道EEG采样频率为8192 Hz。研究人员对原始EEG信号进行预处理,包括重新采样至256 Hz后,使用0.5–70 Hz带通滤波器进行滤波,并重新参考到TP7和TP8电极的平均值。

EEG微状态分析

EEG微状态分析用于研究人脑活动的时间和空间动态。该分析包含四个阶段:全局场功率(GFP)计算、微状态检测、微状态分割及特征提取。通过信号的局部GFP最大值识别每个离散EEG状态,并使用k-means聚类方法分析脑电图以获得最佳微状态类别。在此基础上,计算了四种微状态的特征(如出现频率、持续时间、覆盖率及平均GFP),并记录各微状态在不同受试者中的变化。

递归量化分析(RQA)

为了从EEG信号的不同状态中提取有用的非线性动态特征,研究人员进行了递归量化分析。该方法通过构建相空间的时间嵌入方法,量化信号的复杂和确定性行为。提取特征包括递归率(RR)、确定性(DET)等,这些特征被用于进一步分析EEG信号中的脑电活动动态。

b) 研究主要结果

微状态特征与RQA特征的分类性能

研究利用不同的机器学习算法评估了微状态和RQA特征在AAD中的分类表现,包括k-近邻(KNN)、支持向量机(SVM)、长短期记忆网络(LSTM)、双向长短期记忆网络(Bi-LSTM)和基于Q学习的GRU-CNN方法(GCQL)。实验结果显示,结合微状态均值GFP特征与递归率(RR)特征,并使用GCQL分类器时,AOD检测精度显著提高,达到98.9%。

特征选择与优化

通过Kolmogorov-Smirnov(KS)测试和Mann-Whitney U(Wilcoxon秩和)测试,研究人员发现微状态和RQA的组合特征在分类时表现出显著差异。最终,通过递归率和全局场功率均值的结合,优化得到了最佳多变量特征集,并通过GCQL分类器实现高效的注意力检测。

c) 结论与研究价值

本研究通过一种新的动态方法,基于EEG微状态分析和递归量化分析,进行听觉注意力检测。研究展示了GRU-CNN Q学习模型在无干净听觉刺激情况下,从EEG数据中高效地识别听觉注意力。该方法相较于现有最前沿的AAD方法,在准确率和实时性方面表现更为优越。应用价值方面,该方法在听觉神经辅助设备(如神经引导助听器)中具有潜在的实际应用前景,能够在嘈杂环境中分离和放大听力受损者专注的讲话内容。

d) 研究亮点

  • 创新性方法:首次提出结合微状态和递归量化分析应用于听觉注意力检测。
  • 高准确率:研究方法在1秒以内的EEG分段中实现了98.9%的检测准确率,为当前AAD最前沿方法中的最高水平之一。
  • 无干净刺激要求:不同于前向和后向映射方法,无需干净的听觉刺激,仅依赖于EEG信号,适用于更多真实生活场景。

研究意义与未来展望

本研究提出的GCQL-AAD模型不仅提供了一种基于EEG信号的高效听觉注意力检测方法,还展示了在复杂动态环境中提取脑电活动特征的潜力。未来的研究可以进一步优化电极数量,减少计算负担,同时探索多讲话者环境中的应用。该研究在听觉注意力解码的进展,将为脑-机接口及听觉增强设备领域提供新思路和新方法。