通过视觉道路场景分析驾驶员压力估计

基于视觉道路场景的驾驶员压力估计研究 学术背景 驾驶员压力是导致交通事故、伤害和死亡的重要因素。研究表明,94%的交通事故与驾驶员相关,其中注意力不集中、内外部分心、速度控制不当等都与驾驶员的压力密切相关。因此,识别和管理驾驶员的压力状态对于提升驾驶体验和安全性至关重要。然而,现有的驾驶员压力识别方法主要依赖于生理数据(如心率、皮肤电活动等)或车辆操作数据(如方向盘和踏板活动),这些方法通常需要佩戴设备或缺乏对驾驶环境的全面考虑。相比之下,基于视觉道路场景的分析为驾驶员压力估计提供了一种无侵入式且具有广泛适用性的解决方案。本研究旨在探讨视觉道路场景对驾驶员压力估计的贡献,并通过机器学习模型验证其有效性。 论文来源 本论文由Cristina Bustos、Albert Sole-Ribalta...

算法透明度对用户体验和生理反应的影响

算法透明度对用户体验和生理反应的影响 学术背景 随着情感计算(Affective Computing)技术的快速发展,情感感知任务适应系统(Affect-aware Task Adaptation)逐渐成为研究热点。这类系统通过多种测量手段(如生理信号、面部表情等)识别用户的心理状态,并据此调整计算机任务,以优化用户体验。例如,系统可以根据用户的情绪动态调整游戏难度,或根据用户的认知负荷调整任务复杂性。尽管已有研究表明,提高心理状态识别和任务适应的准确性可以显著改善用户体验,但算法透明度(Algorithmic Transparency)对用户体验的影响尚未得到充分研究。算法透明度指的是用户对计算机决策过程的理解程度。高透明度可能使用户更容忍系统的错误,甚至尝试通过调整自身行为来补偿系统的系...

心智理论能力预测机器人注视对物品偏好的影响

学术背景 在人类社交互动中,目光(gaze)是传递信息的重要方式之一。研究表明,人类的目光能够影响他人的注意力、认知,甚至偏好。例如,当一个人注视某个物体时,观察者会倾向于认为该物体对注视者具有吸引力,进而影响观察者自身的偏好形成。然而,随着机器人技术的快速发展,机器人也逐渐具备了类似人类的目光行为。那么,机器人的目光是否能够像人类目光一样影响他人的偏好?这一问题不仅涉及人类对机器人行为的认知,还关系到未来人机互动(human-robot interaction, HRI)的设计与优化。 此外,心智理论(Theory of Mind, ToM)是理解他人心理状态的核心能力,包括推断他人的意图、信念和情感。ToM在人类社交互动中扮演着重要角色,但其在机器人目光效应中的作用尚未被充分研究。因此,...

基于时频脑电图的新型代理图学习方法用于重度抑郁症检测

基于时频脑电图的抑郁症检测新方法:TFAGL 学术背景 抑郁症(Major Depressive Disorder, MDD)是一种全球范围内常见的精神疾病,其主要症状包括情绪低落、内疚感、自我评价过低,并伴随着兴趣丧失、生活热情减退以及睡眠或食欲紊乱等。根据世界卫生组织(WHO)的统计,全球有超过2.46亿人受到抑郁症的影响,其中约30-35%的重度抑郁症患者每年尝试自杀,导致约2-15%的自杀率。因此,抑郁症预计将在2024年成为导致残疾疾病的主要原因之一。 目前,抑郁症的临床诊断主要依赖于医患对话和问卷调查,诊断结果容易受到患者主观意识和医生专业水平的干扰,缺乏客观性。脑电图(Electroencephalography, EEG)技术能够记录大脑活动的变化,与人类脑活动密切相关,能够...

基于图神经网络的对话情绪识别研究

基于图神经网络的对话情感识别新方法 研究背景 情感识别(Emotion Recognition, ER)是人机交互(Human-Computer Interaction, HCI)中的重要组成部分,旨在通过分析语音、文本、视频等多模态数据,识别人类的情感状态。这一技术在医疗、教育、社交媒体和聊天机器人等领域具有广泛的应用前景。近年来,情感识别的研究逐渐从单句情感分析转向对话情感识别(Emotion Recognition in Conversations, ERC),即识别对话中每一句话的情感状态。与单句情感分析相比,对话情感识别更具挑战性,因为对话中的情感不仅受当前语句的影响,还受到上下文语境和说话者之间互动的影响。 传统的对话情感识别方法主要依赖于循环神经网络(RNN)和长短期记忆网络(...

一种简单高效的面部表情识别网络CSE-GResNet

基于Gabor卷积的高效表情识别网络:CSE-GResNet 学术背景 面部表情识别(Facial Expression Recognition, FER)是计算机视觉领域的一个重要研究方向,广泛应用于社交机器人、医疗保健、社会心理学、客户服务以及心理分析等多个领域。面部表情是人类情感状态和意图的自然、普遍信号,因此,准确识别面部表情对于理解人类情感具有重要意义。然而,现有的FER方法大多关注模型性能的提升,而忽视了计算资源的消耗。在资源受限的平台上,如何在保持高效的同时实现较高的识别性能仍是一个巨大的挑战。 为了解决这一问题,本文提出了一种轻量级且高效的通道移位增强Gabor-ResNet(CSE-GResNet)网络,旨在通过Gabor卷积(Gconv)增强面部图像的关键视觉特征,同时通...

基于语音情感识别的跨语言领域自适应研究

跨语言语音情感识别中的音素锚定领域适应研究 学术背景 语音情感识别(Speech Emotion Recognition, SER)在智能代理、社交机器人、语音助手和自动化呼叫中心系统等应用中具有广泛的应用前景。随着全球化的发展,跨语言语音情感识别(Cross-lingual SER)的需求日益增加。然而,跨语言情感识别面临的主要挑战在于不同语言之间的情感表达方式和声学特征的差异。传统的研究方法主要从计算角度出发,通过特征、领域和标签的适应来应对跨语言问题,但往往忽略了语言之间的潜在共性。 本研究旨在通过引入元音音素(vowel phonemes)作为跨语言情感识别的锚点,解决跨语言情感识别中的语言适应问题。具体而言,作者探讨了不同语言中与特定情感相关的元音共性,并利用这些共性作为跨语言情感...

基于轻量点云网络的面部3D区域结构运动表示用于微表情识别

基于轻量级点云网络的3D区域结构运动表示在微表情识别中的应用 学术背景 微表情(Micro-expressions, MEs)是人类情感表达中的一种短暂且微妙的面部表情,通常持续1/25到1/5秒。由于其自发性、快速性和难以控制的特点,微表情往往能够揭示个体的真实情感,因此在人机交互(Human-Computer Interaction, HCI)、心理学、刑事分析、商务谈判等领域具有重要应用价值。然而,微表情的低强度和短暂性使其识别成为一项极具挑战性的任务。传统的微表情识别方法主要依赖于2D RGB图像中的运动特征提取,忽略了面部结构及其运动在情感传达中的关键作用。为了克服这一局限,本文提出了一种创新的3D面部运动表示方法,结合了3D面部结构、区域化的RGB和结构运动特征,旨在更准确地捕捉...

多尺度双曲对比学习用于跨被试EEG情绪识别

基于多尺度双曲对比学习的跨被试脑电情绪识别研究 学术背景 脑电图(Electroencephalography, EEG)作为一种生理信号,在情感计算(Affective Computing)领域中具有重要应用。与传统的非生理线索(如面部表情或语音)相比,EEG信号具有更高的时间分辨率和客观性,能够更可靠地反映人类的情感状态。然而,EEG信号存在显著的个体差异,这使得跨被试(Cross-Subject)情绪识别成为一个具有挑战性的任务。不同个体的EEG信号受年龄、心理状态、认知特征等多种因素影响,导致预训练模型在新被试上的泛化能力较差。 为了应对这一挑战,研究者们提出了多种方法,包括基于时频域特征的分析、深度学习模型以及迁移学习等。然而,这些方法往往难以在减少被试间差异的同时保留情感特征的区...

基于互信息的多模态情感分析解耦表示学习

多模态情感分析中的互信息解耦表示学习:一项创新研究 学术背景 随着社交媒体的快速发展,用户生成的多媒体内容(如推文、视频等)数量急剧增加。这些多媒体数据通常包含三种模态:视觉(图像)、声学(语音)和文本。这些数据中隐含着丰富的情感信息,如何自动分析这些情感信息成为了一个重要挑战。多模态情感分析(Multimodal Sentiment Analysis, MSA)旨在利用多种信号来识别潜在的情感和情绪。然而,多模态表示学习是这一领域的核心挑战之一,即如何将不同模态的特征有效地整合为统一的表示。 近年来,研究者提出了两种主要方法来解决这一问题:一种方法是将多模态特征分解为模态不变(modality-invariant)和模态特定(modality-specific)的部分;另一种方法则是利用互...