基于反事实推理的多模态公众演讲焦虑检测通用去偏框架
学术背景与问题引入 在当今教育领域,公共演讲焦虑(Public Speaking Anxiety, PSA)是一个普遍存在的现象,尤其是在非母语学习者中。这种焦虑不仅影响学习者的表达能力,还可能阻碍其个人发展。为了帮助学习者克服这一问题,研究者们开始探索如何通过多模态数据(如视频、音频和文本)自动检测演讲焦虑状态。然而,现有的多模态公共演讲焦虑检测(Multimodal Public Speaking Anxiety Detection, MPSAD)模型在训练过程中容易受到多种潜在偏差的影响,例如上下文偏差(context bias)、标签偏差(label bias)和关键词偏差(keyword bias)。这些偏差会导致模型过度依赖某些表面特征,而未能充分利用多模态信息,从而降低检测的准...