目标检测-术语-FmRead学术前沿

学术背景随着公共安全需求的日益增加，尤其是在大型宗教活动如麦加朝觐（Hajj）期间，密集人群中的异常行为检测成为了一个至关重要的课题。现有的检测方法在面对遮挡、光照变化和统一着装等复杂条件时，往往表现不佳，导致检测精度下降。为了应对这些挑战，研究者们致力于开发更为先进的计算机视觉技术，以提高实时监测的准确性和效率。本研究的核心在于提出一种改进的YOLOv8模型——Crowd Anomaly Detection Framework (CADF)，通过集成Soft-NMS（非极大值抑制的软版本）技术，显著提升了在复杂环境下的检测精度。该研究不仅针对Hajj朝觐的特殊场景进行了优化，还在多个公开数据集上进行了验证，展示了其广泛的适用性和鲁棒性。论文来源本论文由Rabia Nasir、Zak...

知识概率化在集成蒸馏中的应用研究学术背景：研究的意义与问题的提出近年来，深度神经网络（Deep Neural Networks, DNN）因其卓越的预测能力，在自动驾驶、医疗诊断、气候预测等安全关键领域得到了广泛应用。然而，这些领域对模型的需求不止于高预测精度，更要求模型能够提供可靠的不确定性量化（Uncertainty Quantification）。尤其是在诸如自动驾驶车辆面对雪天等复杂环境时，模型的过高自信可能导致不安全的决策；因此，增强不确定性量化已成为深度学习应用的重要课题之一。深度集成学习（Deep Ensemble）因其在提升预测精度和不确定性量化能力方面的显著效果，成为近年来的重要研究方向。然而，集成模型由于需要大规模的计算与存储资源，在实际应用中，尤其是资源有限的环境...

学术背景与问题提出水下图像在海洋探测、水下机器人、海洋生物识别等领域具有重要应用价值。然而，由于水对光的折射和吸收作用，水下图像通常存在对比度低、颜色失真等问题，严重影响了后续的感知任务（如目标检测、语义分割等）的准确性。现有的水下图像增强方法主要关注视觉质量的提升，而忽略了增强图像在后续任务中的实际应用效果。因此，如何在视觉质量提升和实际应用之间找到平衡，成为了当前研究的一个重要挑战。为了解决这一问题，本文提出了一种基于启发式可逆网络的水下感知增强方法（HUPE）。该方法不仅能够提升水下图像的视觉质量，还能通过语义协作学习模块提取任务导向的语义特征，从而更好地服务于后续的感知任务。论文来源与作者信息本文由Zengxi Zhang、Zhiying Jiang、Long Ma、Jiny...

引言跌倒事件在多个临床人群中普遍存在，通常的风险评估包括对个体步态进行视觉观察。然而，对步态的观察评估通常局限在实验室内对个体进行规范的步行协议测试，以识别可能增加跌倒风险的缺陷，但微妙的缺陷可能不易被观察到。为此，客观方法（例如惯性测量单元，IMUs）对于定量分析高分辨率的步态特征是有用的，这有助于通过捕捉细微差别来提高跌倒风险评估的信息量。然而，仅依赖IMU的步态仪器化分析存在局限性，它没有考虑到参与者的行为以及环境中的细节（例如障碍物）。视频眼动仪可能提供了评估跌倒风险的额外见解，通过记录头部和眼睛的运动，可以了解人们基于头部和眼睛的动作来遍历环境的方式。但是，手动评估视频数据以评估头部和眼睛的动作既耗时又具有主观性。因此，迫切需要自动化的方法，但目前尚不存在。本文提出了一种基于深度...

GMConv:实现对神经网络卷积核有效感受野的调节前言卷积神经网络（Convolutional Neural Networks，简称CNNs）通过卷积核的使用在计算机视觉任务上取得了显著的成功，包括图像分类、目标检测等。然而，近年来视觉转换器（Vision Transformers，简称ViTs）的出现逐渐受到关注，因为它们在视觉识别任务中表现优异，有时甚至超越了CNNs。尽管如此，改善CNNs的努力从未止步，许多研究工作致力于设计新的CNN架构，特别是大核卷积CNNs在准确性等方面展现了与最先进的ViTs相媲美的表现。本文研究的重点在于CNN中的有效感受野（Effective Receptive Fields，简称ERFs），ERF表示特定输入像素对输出像素的贡献。研究发现ERFs通...

基于YOLOv8的实时密集人群异常行为检测增强框架

知识概率化在集合蒸馏中的应用：提升目标检测器的准确性和不确定性量化

基于启发式可逆网络的水下感知增强方法

利用深度学习增强视觉步态分析中的跌倒风险评估

GMConv:实现对神经网络卷积核有效感受野的调节