利用深度学习增强视觉步态分析中的跌倒风险评估

引言 跌倒事件在多个临床人群中普遍存在,通常的风险评估包括对个体步态进行视觉观察。然而,对步态的观察评估通常局限在实验室内对个体进行规范的步行协议测试,以识别可能增加跌倒风险的缺陷,但微妙的缺陷可能不易被观察到。为此,客观方法(例如惯性测量单元,IMUs)对于定量分析高分辨率的步态特征是有用的,这有助于通过捕捉细微差别来提高跌倒风险评估的信息量。然而,仅依赖IMU的步态仪器化分析存在局限性,它没有考虑到参与者的行为以及环境中的细节(例如障碍物)。视频眼动仪可能提供了评估跌倒风险的额外见解,通过记录头部和眼睛的运动,可以了解人们基于头部和眼睛的动作来遍历环境的方式。但是,手动评估视频数据以评估头部和眼睛的动作既耗时又具有主观性。因此,迫切需要自动化的方法,但目前尚不存在。本文提出了一种基于深度...

GMConv:实现对神经网络卷积核有效感受野的调节

GMConv:实现对神经网络卷积核有效感受野的调节 前言 卷积神经网络(Convolutional Neural Networks,简称CNNs)通过卷积核的使用在计算机视觉任务上取得了显著的成功,包括图像分类、目标检测等。然而,近年来视觉转换器(Vision Transformers,简称ViTs)的出现逐渐受到关注,因为它们在视觉识别任务中表现优异,有时甚至超越了CNNs。尽管如此,改善CNNs的努力从未止步,许多研究工作致力于设计新的CNN架构,特别是大核卷积CNNs在准确性等方面展现了与最先进的ViTs相媲美的表现。 本文研究的重点在于CNN中的有效感受野(Effective Receptive Fields,简称ERFs),ERF表示特定输入像素对输出像素的贡献。研究发现ERFs通...