信息科学-学科-FmRead学术前沿

学术背景在人类社交互动中，目光（gaze）是传递信息的重要方式之一。研究表明，人类的目光能够影响他人的注意力、认知，甚至偏好。例如，当一个人注视某个物体时，观察者会倾向于认为该物体对注视者具有吸引力，进而影响观察者自身的偏好形成。然而，随着机器人技术的快速发展，机器人也逐渐具备了类似人类的目光行为。那么，机器人的目光是否能够像人类目光一样影响他人的偏好？这一问题不仅涉及人类对机器人行为的认知，还关系到未来人机互动（human-robot interaction, HRI）的设计与优化。此外，心智理论（Theory of Mind, ToM）是理解他人心理状态的核心能力，包括推断他人的意图、信念和情感。ToM在人类社交互动中扮演着重要角色，但其在机器人目光效应中的作用尚未被充分研究。因此，...

基于时频脑电图的抑郁症检测新方法：TFAGL 学术背景抑郁症（Major Depressive Disorder, MDD）是一种全球范围内常见的精神疾病，其主要症状包括情绪低落、内疚感、自我评价过低，并伴随着兴趣丧失、生活热情减退以及睡眠或食欲紊乱等。根据世界卫生组织（WHO）的统计，全球有超过2.46亿人受到抑郁症的影响，其中约30-35%的重度抑郁症患者每年尝试自杀，导致约2-15%的自杀率。因此，抑郁症预计将在2024年成为导致残疾疾病的主要原因之一。目前，抑郁症的临床诊断主要依赖于医患对话和问卷调查，诊断结果容易受到患者主观意识和医生专业水平的干扰，缺乏客观性。脑电图（Electroencephalography, EEG）技术能够记录大脑活动的变化，与人类脑活动密切相关，能够...

基于图神经网络的对话情感识别新方法研究背景情感识别（Emotion Recognition, ER）是人机交互（Human-Computer Interaction, HCI）中的重要组成部分，旨在通过分析语音、文本、视频等多模态数据，识别人类的情感状态。这一技术在医疗、教育、社交媒体和聊天机器人等领域具有广泛的应用前景。近年来，情感识别的研究逐渐从单句情感分析转向对话情感识别（Emotion Recognition in Conversations, ERC），即识别对话中每一句话的情感状态。与单句情感分析相比，对话情感识别更具挑战性，因为对话中的情感不仅受当前语句的影响，还受到上下文语境和说话者之间互动的影响。传统的对话情感识别方法主要依赖于循环神经网络（RNN）和长短期记忆网络（...

基于Gabor卷积的高效表情识别网络：CSE-GResNet 学术背景面部表情识别（Facial Expression Recognition, FER）是计算机视觉领域的一个重要研究方向，广泛应用于社交机器人、医疗保健、社会心理学、客户服务以及心理分析等多个领域。面部表情是人类情感状态和意图的自然、普遍信号，因此，准确识别面部表情对于理解人类情感具有重要意义。然而，现有的FER方法大多关注模型性能的提升，而忽视了计算资源的消耗。在资源受限的平台上，如何在保持高效的同时实现较高的识别性能仍是一个巨大的挑战。为了解决这一问题，本文提出了一种轻量级且高效的通道移位增强Gabor-ResNet（CSE-GResNet）网络，旨在通过Gabor卷积（Gconv）增强面部图像的关键视觉特征，同时通...

跨语言语音情感识别中的音素锚定领域适应研究学术背景语音情感识别（Speech Emotion Recognition, SER）在智能代理、社交机器人、语音助手和自动化呼叫中心系统等应用中具有广泛的应用前景。随着全球化的发展，跨语言语音情感识别（Cross-lingual SER）的需求日益增加。然而，跨语言情感识别面临的主要挑战在于不同语言之间的情感表达方式和声学特征的差异。传统的研究方法主要从计算角度出发，通过特征、领域和标签的适应来应对跨语言问题，但往往忽略了语言之间的潜在共性。本研究旨在通过引入元音音素（vowel phonemes）作为跨语言情感识别的锚点，解决跨语言情感识别中的语言适应问题。具体而言，作者探讨了不同语言中与特定情感相关的元音共性，并利用这些共性作为跨语言情感...

基于轻量级点云网络的3D区域结构运动表示在微表情识别中的应用学术背景微表情（Micro-expressions, MEs）是人类情感表达中的一种短暂且微妙的面部表情，通常持续1/25到1/5秒。由于其自发性、快速性和难以控制的特点，微表情往往能够揭示个体的真实情感，因此在人机交互（Human-Computer Interaction, HCI）、心理学、刑事分析、商务谈判等领域具有重要应用价值。然而，微表情的低强度和短暂性使其识别成为一项极具挑战性的任务。传统的微表情识别方法主要依赖于2D RGB图像中的运动特征提取，忽略了面部结构及其运动在情感传达中的关键作用。为了克服这一局限，本文提出了一种创新的3D面部运动表示方法，结合了3D面部结构、区域化的RGB和结构运动特征，旨在更准确地捕捉...

基于多尺度双曲对比学习的跨被试脑电情绪识别研究学术背景脑电图（Electroencephalography, EEG）作为一种生理信号，在情感计算（Affective Computing）领域中具有重要应用。与传统的非生理线索（如面部表情或语音）相比，EEG信号具有更高的时间分辨率和客观性，能够更可靠地反映人类的情感状态。然而，EEG信号存在显著的个体差异，这使得跨被试（Cross-Subject）情绪识别成为一个具有挑战性的任务。不同个体的EEG信号受年龄、心理状态、认知特征等多种因素影响，导致预训练模型在新被试上的泛化能力较差。为了应对这一挑战，研究者们提出了多种方法，包括基于时频域特征的分析、深度学习模型以及迁移学习等。然而，这些方法往往难以在减少被试间差异的同时保留情感特征的区...

多模态情感分析中的互信息解耦表示学习：一项创新研究学术背景随着社交媒体的快速发展，用户生成的多媒体内容（如推文、视频等）数量急剧增加。这些多媒体数据通常包含三种模态：视觉（图像）、声学（语音）和文本。这些数据中隐含着丰富的情感信息，如何自动分析这些情感信息成为了一个重要挑战。多模态情感分析（Multimodal Sentiment Analysis, MSA）旨在利用多种信号来识别潜在的情感和情绪。然而，多模态表示学习是这一领域的核心挑战之一，即如何将不同模态的特征有效地整合为统一的表示。近年来，研究者提出了两种主要方法来解决这一问题：一种方法是将多模态特征分解为模态不变（modality-invariant）和模态特定（modality-specific）的部分；另一种方法则是利用互...

基于频谱-时间调制特征的双流鲁棒语音情感识别研究学术背景语音情感识别（Speech Emotion Recognition, SER）是通过分析人类语音中的情感内容来识别情绪的技术。它在人机交互、客户服务管理系统以及医疗等领域具有广泛的应用潜力。然而，尽管基于深度学习的SER模型在受控环境中表现出色，但在真实环境中的噪声条件下，其性能显著下降。噪声（如交通噪声、风扇噪声等）会严重干扰语音信号，导致情感识别系统的准确性大幅降低。因此，开发一种在噪声环境下依然鲁棒的SER系统成为了一个重要的研究方向。传统的SER系统通常依赖于梅尔频率倒谱系数（Mel-Frequency Cepstral Coefficients, MFCC）和梅尔频谱图等声学特征。然而，这些特征在噪声环境下容易受到干扰，...

从认知任务中的异质神经响应推断潜在神经环路学术背景在认知任务中，大脑的高级皮层区域（如前额叶皮层，prefrontal cortex, PFC）负责整合多种感觉、认知和运动信号。然而，单个神经元的响应通常表现出复杂的异质性（heterogeneity），即它们同时对多个任务变量做出响应。这种异质性使得研究者难以从神经活动中直接推断出驱动行为的神经环路机制。传统的维度降维方法（dimensionality reduction methods）依赖于神经活动与任务变量之间的相关性，但无法揭示这些异质响应背后的神经环路连接。为了解决这一问题，Christopher Langdon和Tatiana A. Engel开发了一种新的维度降维方法——潜在环路模型（Latent Circuit Mod...

心智理论能力预测机器人注视对物品偏好的影响

基于时频脑电图的新型代理图学习方法用于重度抑郁症检测

基于图神经网络的对话情绪识别研究

一种简单高效的面部表情识别网络CSE-GResNet

基于语音情感识别的跨语言领域自适应研究

基于轻量点云网络的面部3D区域结构运动表示用于微表情识别

多尺度双曲对比学习用于跨被试EEG情绪识别

基于互信息的多模态情感分析解耦表示学习

基于频谱-时间调制特征的双流鲁棒语音情感识别

从认知任务中的异质神经响应推断潜在神经环路