基于图神经网络的对话情绪识别研究

基于图神经网络的对话情感识别新方法 研究背景 情感识别(Emotion Recognition, ER)是人机交互(Human-Computer Interaction, HCI)中的重要组成部分,旨在通过分析语音、文本、视频等多模态数据,识别人类的情感状态。这一技术在医疗、教育、社交媒体和聊天机器人等领域具有广泛的应用前景。近年来,情感识别的研究逐渐从单句情感分析转向对话情感识别(Emotion Recognition in Conversations, ERC),即识别对话中每一句话的情感状态。与单句情感分析相比,对话情感识别更具挑战性,因为对话中的情感不仅受当前语句的影响,还受到上下文语境和说话者之间互动的影响。 传统的对话情感识别方法主要依赖于循环神经网络(RNN)和长短期记忆网络(...

基于相互监督框架的指代表达分割与生成

基于相互监督框架的指代表达分割与生成

一种用于指代表达分割与生成的互监督框架 研究背景与问题提出 近年来,视觉-语言交互技术在人工智能领域取得了显著进展。其中,指代表达分割(Referring Expression Segmentation, RES)和指代表达生成(Referring Expression Generation, REG)作为两个核心任务,分别旨在根据自然语言描述定位图像中的目标对象并生成其分割掩码,以及为特定目标生成清晰准确的语言描述。尽管这两个任务本质上是互逆的,但它们的研究通常被分开进行,缺乏系统性地探讨两者如何相互促进的方法。 现有研究面临的主要问题包括:1)RES任务依赖大量标注数据,而这些数据的获取成本高昂;2)REG生成的表达可能存在歧义,难以准确定位目标对象;3)联合训练RES和REG的任务虽然...

基于语义和神经影像元分析揭示的域一般性唤醒证据

关于“域一般性唤醒”的神经科学研究报告 学术背景 唤醒(Arousal)是神经科学中的一个核心概念,指的是大脑和身体状态的波动,通常与动机行为相关联。尽管“唤醒”一词被广泛应用,但其定义却一直含糊不清,不同教科书对此有不同的解释。一种观点认为,唤醒是多种生物过程的抽象反映;另一种观点则认为,唤醒具有共同的神经基础。这种概念上的分歧使得唤醒的分类和定义成为一个亟待解决的问题。此外,科学文献中关于唤醒的研究非常丰富(约50,000篇文章),但从未有系统性的综述或数据驱动的分析来揭示其本质。为了填补这一空白,本研究利用大规模文本挖掘技术和神经影像学元分析方法,揭示了“域一般性唤醒”(domain-general arousal)的存在,即在不同情境(如认知任务、情感背景、从睡眠到觉醒的过渡或性行为...

基于CORDIC的高效激活函数实现方法,用于FPGA上的RNN加速

RNN高效激活函数实现:CORDIC算法与FPGA硬件加速的突破 背景与研究意义 近年来,随着深度学习技术的迅猛发展,循环神经网络(Recurrent Neural Networks, RNNs)尤其是长短时记忆网络(Long Short-Term Memory, LSTM),在时间序列任务中展现出了强大的能力,例如在自然语言处理(Natural Language Processing, NLP)、语音识别和医学诊断等领域取得了广泛应用。然而,与卷积神经网络(Convolutional Neural Networks, CNNs)相比,RNN模型因其复杂性和大量非线性激活函数需求,导致计算代价显著增加。特别是在资源有限的边缘设备(Edge Devices)中部署RNN模型时,激活函数的实现成...

利用大型语言模型评估社交媒体上对胰高血糖素样肽-1受体激动剂的公众看法

在全球范围内,肥胖的流行趋势不断上升,给公共卫生带来了重大的影响。肥胖独立地与心血管疾病的发病率和死亡率相关联,估计每年将为卫生系统带来超过2000亿美元的经济负担。近年来,胰高血糖素样肽-1(GLP-1)受体激动剂因其在体重减轻和心血管风险降低中独立于糖尿病的作用而成为改变实践的治疗方案。在这一背景下,史丹福大学的Sulaiman Somani、Sneha S. Jain、Ashish Sarraju、Alexander T. Sandhu、Tina Hernandez-Boussard和Fatima Rodriguez等人展开了一项关于GLP-1受体激动剂在社交媒体上公众认知的研究,并在《Communications Medicine》2024年发布了他们的研究成果。 该研究采用了大型语...

使用异构图卷积网络进行电子健康记录文本分类的增强混合方法

使用异构图卷积网络进行电子健康记录文本分类的增强混合方法

EHR-HGCN:一种用于电子健康记录文本分类的新型混合异构图卷积网络方法 学术背景介绍 随着自然语言处理(NLP)的迅速发展,文本分类已经成为该领域一个重要的研究方向。文本分类不仅帮助我们理解文献背后的知识,还在生物医学文本,包括电子健康记录(Electronic Health Records, EHR)等领域有着广泛的应用。现有的研究主要集中在基于双向变压器的编码表示方法(如BERT)和卷积神经网络(CNN)的深度学习方法。然而,这些方法在处理医学长文本时往往面临输入长度的限制和高计算资源的需求。与此同时,针对文本分类的代表性CNN方法往往只提取了附近上下文特征,忽略了文本中更长范围的关系。 为了解决这些问题,近年来异构图卷积网络(Heterogeneous Graph Convolut...

将大型语言模型和知识图谱统一起来

统一大语言模型与知识图谱 背景 近年来,自然语言处理和人工智能领域涌现了大量研究成果,其中,大语言模型(Large Language Models, LLMS)如 ChatGPT 和 GPT-4 表现出色。然而,尽管这些模型具有出色的泛化能力,常常因其黑箱性质无法有效捕捉和访问事实知识而受到批评。另一方面,知识图谱(Knowledge Graphs, KGs)如 Wikipedia 和 Huapu 通过结构化形式存储了大量事实知识,但构建和演化知识图谱的过程却非常复杂。因此,研究人员提出将大语言模型与知识图谱相结合,利用两者的优势以实现互补。 来源 本文发表在《IEEE Transactions on Knowledge and Data Engineering》2024年7月第36卷第7期...

大语言模型利用电子健康记录中识别健康的社会决定因素

大语言模型利用电子健康记录中识别健康的社会决定因素 背景及研究动机 健康社会决定因素(Social Determinants of Health, SDOH)对患者的健康结果具有重要影响。然而,在电子健康记录(EHR)结构化数据中,这些因素的记录往往不完整或缺失。大语言模型(Large Language Models, LLMs)有望从EHR的叙述性文本中高通量提取SDOH,以支持研究和临床护理。然而,类别不平衡和数据限制为这种稀疏记录的关键信息带来了挑战。本文旨在探讨使用LLMs从EHR叙述性文本中提取六种SDOH类别(就业、住房、交通、父母身份、关系和社会支持)的最佳方法。 研究来源 这项研究由Harvard Medical School的Mass General Brigham人工智能...