具备完全神经形态视觉与控制的自动驾驶飞行器

具备完全神经形态视觉与控制的自动驾驶飞行器

具备完全神经形态视觉与控制的自动驾驶飞行器 背景与研究动机 过去十年间,深度人工神经网络(ANNs)在人工智能领域取得了巨大进步,特别是在视觉处理方面。然而,这些先进的视觉处理技术在实现高精确度的同时,往往需要大量且耗能的计算资源,这使得其在小型飞行机器人等资源受限的情况下难以应用。 针对这一问题,神经形态硬件通过模仿生物大脑的稀疏、异步特性,实现了更高效的感知与处理能力。在机器人领域,神经形态硬件中的事件驱动相机和脉冲神经网络(SNNs)具有低延迟、低能耗的潜力。然而,当前嵌入式神经形态处理器的限制和脉冲神经网络训练的挑战使得这些技术主要应用于低维度的感知和动作任务。 为解决这些问题,本文展示了一个全神经形态的视觉到控制的流水线,用于控制飞行中的无人机。具体而言,我们训练了一个脉冲神经网络...

深度强化学习为双足机器人赋能敏捷的足球技能

深度强化学习为双足机器人赋能敏捷的足球技能

深度强化学习为双足机器人赋能敏捷的足球技能 背景介绍 智能体在物理世界中展现出敏捷、灵活和理解能力,是人工智能(Artificial Intelligence,AI)研究长期以来的目标之一。然而,动物和人类不仅能流畅地完成复杂的身体动作,还能感知和理解环境,并通过身体在世界中实现复杂的目标。从历史上看,创造具有复杂运动能力的智能化身体代理的尝试由来已久,无论是在仿真环境中还是在现实中。伴随近几年技术的加速进步,尤其是基于学习的方法对这一领域的推进,深度强化学习(Deep Reinforcement Learning,Deep RL)已经证明其能够高效解决复杂的运动控制问题,无论是对于仿真角色还是物理机器人。 然而,对于人形和双足机器人,由于其在稳定性、机器人安全性、自由度数量和硬件可用性方面...

能够自主导航行走的轮腿机器人

能够自主导航行走的轮腿机器人

能够自主导航行走的轮腿机器人 背景介绍 城市化进程的加速让供应链物流尤其是最后一公里配送面临巨大挑战。随着交通压力增加和对更快配送服务需求的上升,尤其是室内和街道上的复杂路线给配送带来了难以解决的问题。传统的轮式机器人难以跨越复杂的障碍物,而仅靠腿式系统又无法达到所需的速度和效率。例如,ANYmal机器人虽具备一定的移动能力,但其最大行驶速度仅为平均人行速度的一半,且续航时间也有限。因此,需开发一种即能在平坦地面上高效运动又能跨越障碍物的机器人系统成为了研究的主要方向。 本文主要研究的是轮腿机器人,结合轮子和腿部的优势,使其在长距离运输中既能在中等地面上高速行驶,又能在复杂地形上保持灵活性。 论文来源 本文由Joonho Lee、Marko Bjelonic、Alexander Reske、...

立体人工复眼用于三维空间中的时空感知

立体人工复眼用于三维空间中的时空感知

立体人工复眼用于三维空间的时空感知 本研究文章发表在2024年5月15日的《Science Robotics》期刊上,题为“立体人工复眼用于三维空间的时空感知(Stereoscopic Artificial Compound Eyes for Spatiotemporal Perception in Three-Dimensional Space)”,第一作者为Byungjoon Bae,指导作者为Kyusang Lee。研究团队主要来自University of Virginia的电气与计算机工程系和材料科学与工程系。 研究背景 在自然界中,节肢动物(arthropods)的复眼是非常有效的生物视觉系统,具备广阔的视野(Field of View, FOV)和高运动敏感度,而祷蛾(mant...

基于强化学习实现的现实世界人形机器人行走

基于强化学习实现的现实世界人形机器人行走

基于强化学习实现的现实世界人形机器人行走 背景介绍 人形机器人在多样化环境中自主操作的潜力巨大,不仅可缓解工厂里的劳动力短缺,还能帮助居家老人并开拓新行星。尽管经典控制器在某些场景下显示出色的效果,但在新环境中的推广和适应性仍是一个重大挑战。为此,本文提出了一种完全基于学习的方法用于实际世界中的人形机器人运动控制。 研究动机 经典控制方法在实现稳定和鲁棒的运动控制方面有很大进展,但其适应性和通用性受限。而基于学习的方法由于能从多样化的模拟或实际环境中学习,逐渐受到更多关注。本文旨在通过使用强化学习训练一种基于Transformer网络的控制器,实现人形机器人在复杂环境中的运动控制。 作者与出版信息 本文由Ilija Radosavovic, Tete Xiao, Bike Zhang, Tr...

用于机器人视觉的基于半球形纳米线阵列的超宽视场针孔复眼

用于机器人视觉的基于半球形纳米线阵列的超宽视场针孔复眼

用于机器人视觉的基于半球形纳米线阵列的超宽视场针孔复眼 在当代人工智能和机器人技术的迅猛发展中,视觉系统作为其中至关重要的一环,得到了广泛的关注和深入的研究。根据Zhou等人于2024年5月15日发表在《Science Robotics》上的研究论文,他们提出了一种新颖的基于生物复眼设计的人工视觉系统,该系统结合了三维打印的蜂巢结构和半球形钙钛矿纳米线光电检测阵列,从而实现了超宽视场、精准目标定位及运动跟踪功能。本文对该研究的背景、方法、结果及意义进行了全面解析。 研究背景 生物进化赋予了自然界各种视觉系统以卓越的视觉能力。例如,昆虫的复眼通过广阔的视野和快速的运动跟踪功能在自然界中取得了显著的优势。这些能力对于机器人系统具有巨大的应用潜力。然而,当前的人工复眼系统大多数依赖于可变形电子器件...

基于结构MRI的阿尔茨海默病诊断的多模板元信息正则化网络

基于结构MRI的阿尔茨海默病诊断的多模板元信息正则化网络

阿尔茨海默症诊断的多模板元信息正则化网络:基于结构磁共振成像的研究 研究背景 阿尔茨海默症(Alzheimer’s Disease, AD)是一种渐进性神经退行性疾病,其诊断和早期检测是医疗领域的重要挑战。结构磁共振成像(Structural MRI, sMRI)因其能够提供详细的大脑形态学模式和解剖特征,已广泛应用于计算机辅助的阿尔茨海默症诊断。尽管之前的研究验证了结合元数据(如年龄、性别和教育年限)对sMRI进行AD诊断的有效性,但现有方法主要关注于元数据与AD的相关性或混杂效应,如性别偏差和正常老化问题,难以充分挖掘元数据对AD诊断的影响。为了解决这些问题,该研究构建了一种新颖的多模板元信息正则化网络(Multi-template Meta-information Regularize...

基于噪声生成和成像机制的隐式正则化学习网络用于低剂量CT重建

基于噪声生成和成像机制的隐式正则化学习网络用于低剂量CT重建

基于噪声生成和成像机制的隐式正则化学习网络在低剂量CT重建中的应用 低剂量计算机断层扫描(Low-Dose Computed Tomography,LDCT)已成为现代医学成像的重要工具,旨在降低放射性风险并保持图像质量。然而,降低X射线剂量常导致数据受损并引起反投影(FBP)重建不良,进而影响图像质量。为了应对这一问题,研究人员不断开发高级算法以在减少噪声和伪影的同时获取高质量图像。本次报道将详细介绍一项新的研究成果,旨在实现高性能的LDCT重建。 背景介绍 在X射线CT成像中,减少辐射剂量一直是追求的目标,通过降低X射线管电流和/或电压,稀疏视图以及限制角度扫描来实现。然而,这些成像协议可能导致数据损坏和不稳定重建,从而使用经典的FBP算法得到的图像质量较差。因此,开发新的高质量重建算法...

通过互相增强的跨模态图像生成与配准方法进行未对齐PAT和MRI图像的无监督融合

通过互相增强的跨模态图像生成与配准方法进行未对齐PAT和MRI图像的无监督融合 背景和研究目的 近年来,光声断层成像(Photoacoustic Tomography, PAT)和磁共振成像(Magnetic Resonance Imaging, MRI)作为前沿的生物医学成像技术在临床前研究中广泛应用。PAT能够提供高光学对比度和深层成像,但软组织对比度较差;而MRI具有优异的软组织成像能力,但时间分辨率较低。尽管多模态数据融合方面取得了一定进展,但由于图像未对准和空间失真的问题,PAT和MRI图像融合仍具有挑战性。 为了解决这些问题,本文作者提出了一种称为PAMRFuse的分阶段深度学习框架,重点在于未对准的PAT和MRI图像融合。该框架包括一个多模态到单模态的配准网络,用于准确对准输入...

面向医学图像分割的模型异质半监督联邦学习

面向医学图像分割的模型异质半监督联邦学习

医学影像分割的模型异质半监督联邦学习 背景介绍 医学图像分割在临床诊断中具有至关重要的作用,它帮助医生识别和分析病情。然而,该任务通常面临敏感数据、隐私问题及昂贵的标注费用等挑战。尽管当前研究主要聚焦于个性化协作训练医学分割系统,但忽视了获取分割标注是耗时且费力的。如何在保持本地模型个性化的同时平衡标注成本和分割性能,已成为研究的一个重要方向。因此,本研究引入了一种新颖的模型异质半监督联邦学习框架。 论文来源 这篇论文题为“Model-Heterogeneous Semi-Supervised Federated Learning for Medical Image Segmentation”,由Yuxi Ma、Jiacheng Wang、Jing Yang和Liansheng Wang共同...