自然对话中的言语诱发抑制
在人与人交流时,脑部对自我语音与他人语音的处理存在显著不同,这被称为语音诱导抑制机制(Speech-Induced Suppression, SIS)。此机制涉及到感知路径中的运动效应副本,作用类似于“回音”,帮助过滤出内部产生的信号,避免混淆外部刺激。在语音处理领域,SIS被表现在对自我产生语音的特定抑制,这对于精神病理学如精神分裂症中的听觉幻觉研究有重要意义。虽然单一音节的实验已广泛研究SIS,但对于连续自然对话中的SIS机制还缺乏深入理解。
来源介绍
该研究由Joaquin E. Gonzalez等人进行,研究人员来自布宜诺斯艾利斯大学人工智能实验室、信号、系统和计算智能研究所、数学应用研究所等机构。论文发表于《Communications Biology》杂志,研究探索了自我与他人语音在大脑中的表征差异,特别是自然对话中的SIS效应。
研究详细步骤
a) 研究流程
研究采用了脑电图(EEG)和高质量的语音录音,对自然、无脚本对话中的语音进行分析。主要通过以下步骤进行:
实验设计: 参与者成对进行对象游戏,每对话中双方向屏幕下达任务,两人需通过语音交流以屏幕上物体放置到特定位置。
数据收集: 使用128电极高密度EEG同时记录参与者的脑电活动和语音。每个参与者佩戴定向麦克风同步录制其语音。
信号预处理: 对收集到的EEG信号进行滤波、独立分量分析(ICA),去除眼动和肌肉伪影。
特征提取: 从语音信号中提取了梅尔频谱图(mel-spectrogram)和信号包络(envelope)等特征,为模型训练提供输入。
编码模型构建: 训练编码模型以预测EEG信号的特性响应,从合作任务中的听者脑电活动验证模型性能。
分析对话阶段: 分析对话过程中不同条件下的SIS效应,包括仅他人说话、自我说话和双方同时说话三种条件下的EEG信号反应。
b) 研究主要结果
语音特征的大脑表征: 模型能够显著再现他人语音在大脑中的表征,对于音高和频带等声学特征展现了高效预测性能。平均相关系数在θ频段达到0.26(包络)和0.37(频谱图),显著高于以往研究值。
对自我语音的抑制效应: 在自然对话中自我产生语音未引起明显脑电反应,SIS效应显著。对自我语音的响应类似于沉默状态,只有在听他人语音时EEG记录有显著响应。
c) 研究结论与意义
研究表明,SIS在自然对话中不仅存在而且更强,强调了大脑在处理自我与外部语音刺激时的差异。此方法提供了对自然语境下相关机制更深理解的可能性,对精神病理学研究、语言处理模型及语音用户界面领域具有重要参考价值。
d) 研究亮点
自然对话中的SIS效应: 首次在自然对话情境下验证了SIS效应,为大脑如何区分自我与外部语音提供了新见解。
较高的模型预测性能: 编码模型在预测自然语音情境下的EEG信号表现出显著优于以往实验条件下的性能,证实该方法在复杂情境中的有效性。
脑电相位同步的独立验证: 相位锁定值(PLV)的分析也检验了SIS结果,一致表明在自然对话条件下,自我语音未产生显著的EEG同步信号。
e) 其他有价值的信息
研究提出的编码模型可扩展应用于其他连续非限制性任务的脑电分析,适用于更复杂的自然语言处理研究场景,并为未来研究提供了方法学范例。
结语
该研究通过详细的实验设计和创新的编码模型方法,首次在自然对话情境下揭示了SIS效应,为理解大脑对自然语音信号的处理机制提供了新视角。研究结果不仅扩展了脑科学在自然情境中的应用前景,还有助于未来更多基于自然对话的神经认知和语言学研究。