基于启发式可逆网络的水下感知增强方法

学术背景与问题提出 水下图像在海洋探测、水下机器人、海洋生物识别等领域具有重要应用价值。然而,由于水对光的折射和吸收作用,水下图像通常存在对比度低、颜色失真等问题,严重影响了后续的感知任务(如目标检测、语义分割等)的准确性。现有的水下图像增强方法主要关注视觉质量的提升,而忽略了增强图像在后续任务中的实际应用效果。因此,如何在视觉质量提升和实际应用之间找到平衡,成为了当前研究的一个重要挑战。 为了解决这一问题,本文提出了一种基于启发式可逆网络的水下感知增强方法(HUPE)。该方法不仅能够提升水下图像的视觉质量,还能通过语义协作学习模块提取任务导向的语义特征,从而更好地服务于后续的感知任务。 论文来源与作者信息 本文由Zengxi Zhang、Zhiying Jiang、Long Ma、Jiny...

利用深度学习增强视觉步态分析中的跌倒风险评估

引言 跌倒事件在多个临床人群中普遍存在,通常的风险评估包括对个体步态进行视觉观察。然而,对步态的观察评估通常局限在实验室内对个体进行规范的步行协议测试,以识别可能增加跌倒风险的缺陷,但微妙的缺陷可能不易被观察到。为此,客观方法(例如惯性测量单元,IMUs)对于定量分析高分辨率的步态特征是有用的,这有助于通过捕捉细微差别来提高跌倒风险评估的信息量。然而,仅依赖IMU的步态仪器化分析存在局限性,它没有考虑到参与者的行为以及环境中的细节(例如障碍物)。视频眼动仪可能提供了评估跌倒风险的额外见解,通过记录头部和眼睛的运动,可以了解人们基于头部和眼睛的动作来遍历环境的方式。但是,手动评估视频数据以评估头部和眼睛的动作既耗时又具有主观性。因此,迫切需要自动化的方法,但目前尚不存在。本文提出了一种基于深度...

GMConv:实现对神经网络卷积核有效感受野的调节

GMConv:实现对神经网络卷积核有效感受野的调节 前言 卷积神经网络(Convolutional Neural Networks,简称CNNs)通过卷积核的使用在计算机视觉任务上取得了显著的成功,包括图像分类、目标检测等。然而,近年来视觉转换器(Vision Transformers,简称ViTs)的出现逐渐受到关注,因为它们在视觉识别任务中表现优异,有时甚至超越了CNNs。尽管如此,改善CNNs的努力从未止步,许多研究工作致力于设计新的CNN架构,特别是大核卷积CNNs在准确性等方面展现了与最先进的ViTs相媲美的表现。 本文研究的重点在于CNN中的有效感受野(Effective Receptive Fields,简称ERFs),ERF表示特定输入像素对输出像素的贡献。研究发现ERFs通...