用于语义分割的堆叠反卷积网络

用于语义分割的堆叠反卷积网络

用于语义分割的堆叠反卷积网络 引言 语义分割在计算机视觉领域中是一项关键任务,其目的是对图像中的每一个像素进行分类,预测其类别。然而,现有的全卷积网络(Fully Convolutional Networks, FCNs)在处理空间分辨率方面存在局限性,容易出现物体边界模糊和小物体丢失的问题。为了解决这些问题,本文提出了一种堆叠逆卷积网络(Stacked Deconvolutional Network, SDN)来提升语义分割的效果。 研究背景 在深度卷积神经网络(Deep Convolutional Neural Networks, DCNNs)的推动下,语义分割取得了显著进展。DCNN通过强大的学习能力可以获取高级语义特征,比如图像分类、目标检测和关键点预测等。然而,DCNN在语义分割任...

基于标签内容描述的透明化深度图像美学评估

基于标签内容描述的透明化深度图像美学评估

基于标签内容描述的透明化深度图像美学评估 学术背景 随着社交媒体平台如Instagram和Flickr的普及,图像美学评估(Image Aesthetics Assessment, IAA)模型的需求日益增长。这些模型不仅可以帮助社交网络服务提供商优化图片排序或推荐结果,还能帮助普通用户管理相册、选择最佳照片,甚至在拍摄和编辑过程中提供指导。然而,如何构建一个稳健的IAA模型一直是一个挑战,因为图像美学的复杂性包括对象、摄影技术等多个因素。 研究动机 现有的深度学习方法虽然在IAA中表现出色,但其内部机制仍不明确。大多数研究通过隐性学习语义特征来预测图像美学,但这些方法未能直接解释这些特征具体代表了什么。本文的核心目标是创建一个更透明的IAA框架,引入可解释的语义特征,以人类可读的标签描述图...

由大脑皮质发音表征驱动的双语语音神经假体

由大脑皮质发音表征驱动的双语语音神经假体 背景 在神经假体的发展过程中,从大脑活动解码语言的研究一直集中在单一语言的解码上。因此,双语言语产生依赖于不同语言的独特或共享皮层活动的程度仍不清楚。当前研究通过电皮层图(electrocorticography, ECoG)结合深度学习和统计自然语言模型来记录和解码一名西班牙语-英语双语患者的言语运动皮层活动,并将其转化为两种语言的句子。该研究旨在解决双语解码的实际应用问题,尤其是在不需要手动指定目标语言的情况下,实现言语解码。 言语丧失症(anarthria),即失去清晰发音的能力,是中风和肌萎缩侧索硬化症等神经疾病的严重症状之一。目前,侵入性言语脑-计算机接口(BCI)正在被开发,以通过解码皮层活动恢复患者的自然沟通能力。然而,现有的言语BCI...

大语言模型利用电子健康记录中识别健康的社会决定因素

大语言模型利用电子健康记录中识别健康的社会决定因素 背景及研究动机 健康社会决定因素(Social Determinants of Health, SDOH)对患者的健康结果具有重要影响。然而,在电子健康记录(EHR)结构化数据中,这些因素的记录往往不完整或缺失。大语言模型(Large Language Models, LLMs)有望从EHR的叙述性文本中高通量提取SDOH,以支持研究和临床护理。然而,类别不平衡和数据限制为这种稀疏记录的关键信息带来了挑战。本文旨在探讨使用LLMs从EHR叙述性文本中提取六种SDOH类别(就业、住房、交通、父母身份、关系和社会支持)的最佳方法。 研究来源 这项研究由Harvard Medical School的Mass General Brigham人工智能...

嵌合抗原受体的间充质基质细胞用于增强免疫抑制

嵌合抗原受体的间充质基质细胞用于增强免疫抑制 背景介绍 间充质基质细胞(Mesenchymal Stromal Cells, MSCs)是多能细胞,存在于几乎所有组织中,具有显著的免疫抑制、再生特性。这些特性使得MSCs在免疫疾病和组织再生的治疗中被广泛研究。尽管同种异体MSCs的临床试验展示了其安全性,然而其免疫抑制效能和治疗结果迄今仍未令人满意。为了提高MSCs的免疫抑制效果,本研究通过细胞工程技术,对来自健康供体脂肪来源的初级MSCs进行改造,开发了一种新的治疗策略。 论文来源 本研究由Olivia Sirpilla、R. Leo Sakemura和Mehrdad Hefazi等人完成,隶属于Mayo Clinic的T Cell Engineering部门,以及Division of ...

社交派生信息的皮层转移对情绪识别的门控作用

社交派生信息的皮层转移对情绪识别的门控作用 背景介绍 情绪识别及其随之而来的反应对生存和社会功能的维持具有重要意义。然而,如何处理来自社会信息以可靠地进行情绪识别仍不完全清楚。在这项新研究中,作者揭示了一种进化上保守的长程抑制/兴奋性脑网络在这些社会认知过程中的作用。这项研究通过对从内侧前额叶皮层(medial prefrontal cortex, mPFC)到视网膜后皮层(retrosplenial cortex, RSC)的长程投射网络进行了详细分析,以揭示其在情绪识别过程中的作用。 这些发现的背景重要性在于,情绪识别能力的缺陷会阻止个体在看到同类的情绪变化时提供帮助或逃避威胁。此外,这种社会认知能力的缺陷在某些精神和神经发育障碍(如精神分裂症和自闭症中)很常见,对患者生活有深远影响。大...

建模分析经济决策领域中依靠机器学习建立理论所使用数据集的偏倚

背景介绍 长期以来,规范性(nomative)和描述性(descriptive)模型一直在试图解释和预测人类在面对商品或赌博等风险选择时的决策行为。最近的一项研究通过训练神经网络(Neural Networks, NNs)在一个新的大规模在线数据集choices13k上,发现了一种更准确的人类决策模型。本研究系统地分析了不同模型和数据集之间的关系,并发现了数据集偏差(dataset bias)的证据。研究表明,数据集choices13k中对随机赌博选择的偏好趋向于平衡,可能反映了增加的决策噪声。通过将结构化的决策噪声添加到使用实验室研究数据训练的神经网络中,我们构建了一个贝叶斯生成模型,并发现该模型表现优于其他除choices13k之外的所有模型。 研究来源 此项研究发表于《Nature H...

信息密度较高的语言具有更快的交流速度但会话广度较低

信息密度较高的语言具有更快的交流速度但会话广度较低

信息密度较高的语言具有更快的交流速度但会话广度较低 背景介绍 人类语言在编码信息的方式上存在着广泛的差异,这些差异在一些限定的语义域内(如时间、空间、颜色、人类身体部位和活动等方面)已有较多研究。然而,全球语义信息结构及其与人类沟通的关系尚未有深入的研究。作者们首先提出,跨越约1000种语言样本,显示出语言在信息编码密度上的巨大差异。接着,他们探讨了信息密度较高的语言通过什么方式使语义信息的配置更密集。最后,他们追踪了语言信息密度与沟通模式之间的关系,发现信息密度较高的语言倾向于更快的沟通,但会话的概念范围较窄。 论文来源 这篇文章由Pedro Aceves和James A. Evans撰写,发表在《Nature Human Behaviour》2024年4月刊上。Pedro Aceves隶...

颅内脑电图揭示多个人类大脑区域中的非效应器依赖性证据累积动力学

学术新闻报告:基于脑内电生理记录揭示效应器独立的证据累积动力学 研究背景 在决定形成过程中的神经表现研究一直是神经科学界的重要课题。以往的研究表明,可以通过非侵入式电生理学技术在人类中识别出与感知决策形成相关的神经信号,这些信号能够抽象化处理,而不依赖于具体的运动要求。然而,这些信号在大脑中的具体起源仍未完全清晰。为了解这一问题,本文运用了高时空精度的颅内脑电图(intracranial electroencephalography, iEEG)技术,旨在定位这些抽象决策信号的来源。 论文来源 这篇题为 “intracranial electroencephalography reveals effector-independent evidence accumulation dynamic...

在人类经济交往过程中,黑质中的多巴胺和血清素与价值计算和社会行为有关

在人类经济交往过程中,黑质中的多巴胺和血清素与价值计算和社会行为有关

背景介绍 在当代神经科学研究中,多巴胺(dopamine)和5-羟色胺(serotonin)被假设为指导社会行为的重要神经调节物质。然而,人们对这些神经调节物质在社会互动过程中的动态变化知之甚少。尽管已有非侵入性功能神经影像方法(如脑电图和功能磁共振成像)帮助绘制了大脑中与社会任务相关的“社会脑”网络,但这些方法通常在空间和时间分辨率上存在权衡,且获得的数据反映了电学和化学事件的混合。因此,我们在更精细的生物学尺度上对人类社会脑的理解仍然匮乏。 研究团队提出了一种新的电化学方法,能够在毫秒级别检测到人脑中多巴胺和5-羟色胺的波动。之前的研究已经表明,多巴胺和5-羟色胺在老鼠中对奖赏预期误差和适应性行为起关键作用,但动物模型仍然无法完全代表人类社会互动的复杂性。 研究来源 本文由Seth R....