适应性识别和优化不良区域以实现准确的立体匹配

适应性识别和优化不良区域以实现准确的立体匹配

适应性识别和优化不良区域以实现准确的立体匹配 研究背景和动机 随着计算机视觉技术的快速发展,立体匹配技术因其高准确性、成本效益及非侵入性,在机器人、航天、自动驾驶和工业制造等诸多领域中发挥了至关重要的作用。然而,立体匹配在处理遮挡区域、模糊区域时,像素对之间的一致性约束变得不可靠,导致隐藏对应关系探索的困难。因此,尽管在卷积神经网络(CNN)和基于变换器(Transformer)的研究进展迅速,多数方法在处理不良区域时仍存在性能瓶颈。为了应对这一挑战,研究团队引入了一种误差区域特征优化机制以提供上下文特征,从而改进不良区域的立体匹配效果。 研究来源和简介 本文题为”Adaptively Identify and Refine Ill-Posed Regions for Accurate St...

使用模型投影的联邦学习进行多中心疾病诊断

使用模型投影的联邦学习进行多中心疾病诊断

使用模型投影的联邦学习进行多中心疾病诊断 背景介绍 随着医学影像技术的快速发展,基于自动化诊断方法的研究在单中心数据集上表现出良好的性能。然而,这些方法在实际应用中往往难以泛化到其他医疗机构的数据。主要原因是这些方法通常假设不同医疗中心的数据是独立同分布(IID)的,而实际上不同中心由于使用不同的扫描仪和成像参数,导致数据分布非独立同分布(Non-IID)。此外,不同中心诊断的患者数量和种类也存在较大差异。因此,多中心的数据具有异质性,无法通过集中化学习(Centralized Learning)有效解决这一问题。 近年来,联邦学习(Federated Learning,FL)作为一种去中心化框架,为多中心协同训练全球模型提供了可能,同时还保留了各中心患者数据的隐私。然而,Non-IID数据...

自适应采样人工实际控制在约束系统非零和博弈中的应用

自适应采样人工实际控制在约束系统非零和博弈中的应用 背景 在现代工业和科研领域中,智能技术和控制系统的迅速发展,使得传统的控制方法难以满足保证系统稳定性和最小化能耗的严格要求。实际系统通常非常复杂,至少包含两个控制单元,并存在组件之间错综复杂的竞争与合作关系。这种情况下,设计的控制方案不仅要考虑单个控制器的效益最大化,还要实现全局优化。这类问题通常被视为非零和博弈(Non-Zero-Sum Games,NZSG),在多物理输入约束条件下,处理系统耦合动态是一个重要的研究难题。 论文来源 本文题为《Adaptive Sampling Artificial-Actual Control for Non-Zero-Sum Games of Constrained Systems》由Lu Liu和R...

多尺度视觉中枢引导的多模态神经机器翻译:文本感知的跨模态对比解耦

多尺度视觉中枢引导的多模态神经机器翻译:文本感知的跨模态对比解耦

多尺度视觉中枢引导的多模态神经机器翻译:文本感知的跨模态对比解耦 学术背景 多模态神经机器翻译(Multi-Modal Neural Machine Translation, MNMT)旨在将语言无关的视觉信息引入文本以提升机器翻译的性能。然而,由于图像和文本在模态上的显著差异,这两者之间不可避免会出现语义不匹配的问题。解决这些问题的目标在于通过使用分解的多尺度视觉信息作为跨语言中枢,提高不同语言之间的对齐,从而改进MNMT的表现。 论文来源 这篇论文由朱俊俊、苏瑞和叶俊杰等研究人员撰写,作者分别来自昆明理工大学信息工程与自动化学院、云南大学信息科学与工程学院以及云南省人工智能重点实验室。论文将在2024年发表于著名期刊”Neural Networks”。 研究流程 研究工作主要分为以下几个...

具备完全神经形态视觉与控制的自动驾驶飞行器

具备完全神经形态视觉与控制的自动驾驶飞行器

具备完全神经形态视觉与控制的自动驾驶飞行器 背景与研究动机 过去十年间,深度人工神经网络(ANNs)在人工智能领域取得了巨大进步,特别是在视觉处理方面。然而,这些先进的视觉处理技术在实现高精确度的同时,往往需要大量且耗能的计算资源,这使得其在小型飞行机器人等资源受限的情况下难以应用。 针对这一问题,神经形态硬件通过模仿生物大脑的稀疏、异步特性,实现了更高效的感知与处理能力。在机器人领域,神经形态硬件中的事件驱动相机和脉冲神经网络(SNNs)具有低延迟、低能耗的潜力。然而,当前嵌入式神经形态处理器的限制和脉冲神经网络训练的挑战使得这些技术主要应用于低维度的感知和动作任务。 为解决这些问题,本文展示了一个全神经形态的视觉到控制的流水线,用于控制飞行中的无人机。具体而言,我们训练了一个脉冲神经网络...

深度强化学习为双足机器人赋能敏捷的足球技能

深度强化学习为双足机器人赋能敏捷的足球技能

深度强化学习为双足机器人赋能敏捷的足球技能 背景介绍 智能体在物理世界中展现出敏捷、灵活和理解能力,是人工智能(Artificial Intelligence,AI)研究长期以来的目标之一。然而,动物和人类不仅能流畅地完成复杂的身体动作,还能感知和理解环境,并通过身体在世界中实现复杂的目标。从历史上看,创造具有复杂运动能力的智能化身体代理的尝试由来已久,无论是在仿真环境中还是在现实中。伴随近几年技术的加速进步,尤其是基于学习的方法对这一领域的推进,深度强化学习(Deep Reinforcement Learning,Deep RL)已经证明其能够高效解决复杂的运动控制问题,无论是对于仿真角色还是物理机器人。 然而,对于人形和双足机器人,由于其在稳定性、机器人安全性、自由度数量和硬件可用性方面...

能够自主导航行走的轮腿机器人

能够自主导航行走的轮腿机器人

能够自主导航行走的轮腿机器人 背景介绍 城市化进程的加速让供应链物流尤其是最后一公里配送面临巨大挑战。随着交通压力增加和对更快配送服务需求的上升,尤其是室内和街道上的复杂路线给配送带来了难以解决的问题。传统的轮式机器人难以跨越复杂的障碍物,而仅靠腿式系统又无法达到所需的速度和效率。例如,ANYmal机器人虽具备一定的移动能力,但其最大行驶速度仅为平均人行速度的一半,且续航时间也有限。因此,需开发一种即能在平坦地面上高效运动又能跨越障碍物的机器人系统成为了研究的主要方向。 本文主要研究的是轮腿机器人,结合轮子和腿部的优势,使其在长距离运输中既能在中等地面上高速行驶,又能在复杂地形上保持灵活性。 论文来源 本文由Joonho Lee、Marko Bjelonic、Alexander Reske、...

立体人工复眼用于三维空间中的时空感知

立体人工复眼用于三维空间中的时空感知

立体人工复眼用于三维空间的时空感知 本研究文章发表在2024年5月15日的《Science Robotics》期刊上,题为“立体人工复眼用于三维空间的时空感知(Stereoscopic Artificial Compound Eyes for Spatiotemporal Perception in Three-Dimensional Space)”,第一作者为Byungjoon Bae,指导作者为Kyusang Lee。研究团队主要来自University of Virginia的电气与计算机工程系和材料科学与工程系。 研究背景 在自然界中,节肢动物(arthropods)的复眼是非常有效的生物视觉系统,具备广阔的视野(Field of View, FOV)和高运动敏感度,而祷蛾(mant...

基于强化学习实现的现实世界人形机器人行走

基于强化学习实现的现实世界人形机器人行走

基于强化学习实现的现实世界人形机器人行走 背景介绍 人形机器人在多样化环境中自主操作的潜力巨大,不仅可缓解工厂里的劳动力短缺,还能帮助居家老人并开拓新行星。尽管经典控制器在某些场景下显示出色的效果,但在新环境中的推广和适应性仍是一个重大挑战。为此,本文提出了一种完全基于学习的方法用于实际世界中的人形机器人运动控制。 研究动机 经典控制方法在实现稳定和鲁棒的运动控制方面有很大进展,但其适应性和通用性受限。而基于学习的方法由于能从多样化的模拟或实际环境中学习,逐渐受到更多关注。本文旨在通过使用强化学习训练一种基于Transformer网络的控制器,实现人形机器人在复杂环境中的运动控制。 作者与出版信息 本文由Ilija Radosavovic, Tete Xiao, Bike Zhang, Tr...

用于机器人视觉的基于半球形纳米线阵列的超宽视场针孔复眼

用于机器人视觉的基于半球形纳米线阵列的超宽视场针孔复眼

用于机器人视觉的基于半球形纳米线阵列的超宽视场针孔复眼 在当代人工智能和机器人技术的迅猛发展中,视觉系统作为其中至关重要的一环,得到了广泛的关注和深入的研究。根据Zhou等人于2024年5月15日发表在《Science Robotics》上的研究论文,他们提出了一种新颖的基于生物复眼设计的人工视觉系统,该系统结合了三维打印的蜂巢结构和半球形钙钛矿纳米线光电检测阵列,从而实现了超宽视场、精准目标定位及运动跟踪功能。本文对该研究的背景、方法、结果及意义进行了全面解析。 研究背景 生物进化赋予了自然界各种视觉系统以卓越的视觉能力。例如,昆虫的复眼通过广阔的视野和快速的运动跟踪功能在自然界中取得了显著的优势。这些能力对于机器人系统具有巨大的应用潜力。然而,当前的人工复眼系统大多数依赖于可变形电子器件...