改进的3D指纹特征识别方法:基于可泛化的神经渲染

基于FingerNeRF的3D手指生物识别研究综述 背景与研究意义 随着生物识别技术的发展,三维(3D)生物识别因其更高的准确性、更强的抗伪装能力以及对拍摄角度变化的鲁棒性,逐渐成为主流研究方向之一。其中,3D手指生物识别技术因其生物特征(如指纹、指静脉、指关节等)易于获取且广泛使用,在学术界和工业界备受关注。然而,现有的3D生物识别方法普遍依赖显式的3D重建技术,这些方法在实际应用中面临两大挑战: 信息丢失:显式重建过程中不可避免地会丢失部分细节信息,直接影响后续识别任务的性能。 硬件与算法的紧耦合性:重建算法往往与特定硬件设备绑定,缺乏通用性,难以适应不同模态的数据或设备。 为解决上述问题,研究者提出了一种基于隐式神经辐射场(Neural Radiance Fields, NeRF)的F...

基于课程学习的记忆辅助知识转移框架用于弱监督在线活动检测

研究背景与研究意义 近年来,视频理解领域中弱监督在线活动检测(Weakly Supervised Online Activity Detection, WS-OAD)作为高水平视频理解的一个重要课题,得到了广泛关注。其主要目标是通过仅使用廉价的视频级标注,在流媒体视频中逐帧检测正在进行的活动。这一任务在许多实际应用场景中具有重要价值,包括自动驾驶、公共安全监控、机器人导航及增强现实等。 尽管全监督方法(Fully Supervised Methods)已在在线活动检测(OAD)中取得了显著进展,但它们严重依赖于密集的帧级注释(Frame-level Annotations),这不仅成本高昂且易受噪声影响,从而限制了模型的扩展性。弱监督设置旨在解决这一问题,但因其在线约束(Online Con...

AppTracker+:基于位移不确定性的多目标低帧率视频跟踪方法

低帧率多目标跟踪研究的学术报告 引言与研究背景 近年来,多目标跟踪(Multi-Object Tracking, MOT)技术在智能视频监控、自动驾驶及机器人视觉领域中得到了广泛应用。然而,传统MOT方法大多针对高帧率视频设计,在低帧率视频场景中面临显著挑战。低帧率下,相邻帧之间的目标位移增大,物体外观和可见性变化更加剧烈,这对检测结果的关联和轨迹保持提出了更高要求。由于边缘设备通常受到计算、存储和传输带宽限制,低帧率视频成为高效解决方案的重要选择,但其技术难题亟需解决。 本研究由来自浙江大学和香港科技大学的学者团队完成,发表于 *International Journal of Computer Vision*,题为“AppTracker+: Displacement Uncertaint...

基于少量标注像素和点云的弱监督驾驶场景语义分割

基于少量像素标注与点云数据的驾驶场景弱监督语义分割 背景与研究问题 语义分割作为计算机视觉的重要任务之一,在自动驾驶等领域具有广泛应用。然而,传统的全监督语义分割方法需要大量的像素级标注,标注成本高昂。在弱监督语义分割(Weakly Supervised Semantic Segmentation, WSSS)中,通过较少的粗粒度标注(如图片标签、边框、点级标注等)实现像素级分割,极大地降低了标注成本。 现有的WSSS方法大多基于CAM(类激活图)生成初始分割种子,但在复杂的驾驶场景中,这种方法表现不佳。驾驶场景中的图像通常包含多种物体类别,且类别间的遮挡、重叠问题严重,导致现有基于图片标签的WSSS方法难以达到高精度分割效果。 针对这些问题,本研究提出了一种结合少量点标注和点云数据的新型W...

重新思考用于生物识别数据错误校正的当代深度学习技术

重新思考深度学习技术在生物特征数据纠错中的应用 背景介绍 随着信息技术的发展,生物特征数据在身份验证和安全存储中的应用愈发广泛。传统密码学通常依赖均匀分布且可精确重现的随机字符串,然而,现实中大多数数据(如指纹、虹膜扫描等生物特征)并不具备这样的属性,导致在实际应用中存在生成、存储和检索的诸多挑战。近年来,基于生物特征数据的密码学系统(biometric cryptosystems)被广泛研究,旨在利用独特的生物特征(例如指纹、虹膜等)作为生成加密密钥的来源。然而,由于生物特征数据的固有可变性以及传感器噪声等外部因素,精确恢复加密密钥变得复杂,进而对纠错机制提出了更高的要求。 在这种背景下,近年来深度学习方法凭借其在语音识别、图像处理等领域的卓越表现,被尝试应用于提升生物特征数据的纠错能力。...

自适应中间模态对齐学习用于可见光-红外人体重识别

自适应中间模态对齐学习用于可见光-红外人体重识别

基于可见光和红外跨模态学习的Adaptive Middle-Modality Alignment Learning方法研究 研究背景与问题 在智能监控系统的需求推动下,可见光-红外行人再识别(Visible-Infrared Person Re-identification, VIReID)正逐渐成为一个备受关注的研究领域。该任务旨在通过对不同光谱模态(如可见光与红外)的行人图像进行匹配,实现全天候行人识别。由于可见光和红外图像源自不同的光谱,存在显著的模态差异,包括光照、纹理、颜色等,这使得跨模态匹配成为一大挑战。 传统方法多通过设计复杂的生成对抗网络(Generative Adversarial Networks, GANs)或深度网络模型来缩小模态差异,但这些方法通常存在如下问题: -...

在野外使用SAM学习检测新物种

研究论文报告:基于 SAM 的开放世界物体检测框架 背景介绍 随着生态系统监测的重要性不断提升,野生动植物及植物群体的监测已成为生态保护和农业发展的关键手段。这些监测工作包括估算种群数量、识别物种、研究物种行为以及分析植物病害或多样性。然而,传统的封闭世界物体检测模型通常训练于已标注的单一物种数据,难以泛化到新的物种分类。 当前的生态系统研究在数据和方法上存在诸多挑战,特别是标注数据的不足以及模型对新物种的适应能力有限。基于此,来自美国伊利诺伊大学香槟分校的 Garvita Allabadi、Ana Lucic、Yu-Xiong Wang 和 Vikram Adve 提出了一种面向开放世界的物体检测框架,利用视觉基础模型 Segment Anything Model(SAM),在无需标注新物...

通过驱动压力指导的机械通气优化羊模型局部肺生物力学

机械通气指导下的呼吸压力优化——对肺局部生物力学的改进研究 机械通气在临床操作中常用于治疗急性呼吸窘迫综合症(ARDS)以及全身麻醉后预防肺部并发症。然而,机械通气会导致肺部受到有害的应力和变形,增加临床治疗的复杂性,甚至可能导致死亡。研究表明,呼吸系统的驾驶压力增加(driving pressure)与机械通气相关的死亡率直接相关。因此,本研究旨在探讨这些关联的微观生物力学因素及其在肺内的空间异质性,从而优化机械通气策略。 论文背景 研究机械通气操作下,如何通过调整机械通气的正压呼气末压力(PEEP)以优化局部肺组织的生物力学状态,从而减少因机械通气导致的肺损伤(Ventilator-Induced Lung Injury, VILI),对提高重症监护病房及手术病人的治疗效果具有重大意义。...

通过使用原型网络的单次迁移学习实现中风后手势识别

背景介绍 中风是全球死亡和致残的主要原因之一,随着人口老龄化和城镇化的发展,中风患者总数正在全球范围内增加。尽管治疗的进步降低了死亡率,但幸存者中需要康复治疗的人数却大幅增加。特别是在低收入和中低收入国家,这种情况尤其显著。这些国家的卫生资源有限,因此亟需一种适应性强、成本效益高的康复干预措施(Feigin et al. 2022)。 中风康复是一个漫长且负担沉重的过程,不仅耗费体力,还带来巨大的经济压力,因此自动化评估系统能够减轻康复费用和减少对物理治疗师访视需求的重要性愈发显著。这些系统通过传感器数据评估中风幸存者的运动功能,提供互动康复练习的低成本方法,尤其适合家庭康复(Chen et al. 2017)。此外,将游戏融入这些系统中可以增加中风幸存者的动机和参与度,通过使他们能够从事有...

踝关节背屈动力学要求增加摆动相足离地间隙:论对辅助设备设计和能量需求的影响

科研报告 背景介绍 随着人口老龄化以及中风等神经系统和肌肉系统疾病的增加,步态障碍导致的绊倒和跌倒风险成为一个严重问题。研究表明,踝关节背屈在步态的摆动阶段对确保足部离地高度至关重要。然而,目前对于摆动阶段踝关节动力学和机械能量交换的研究较少。现有的研究主要关注正常行走时的踝关节背屈,而随着多种提供背屈辅助的设备的开发,有必要了解在这些设备中能量需求的最小要求。 近年来,踝关节背屈辅助技术的发展迅速,特别是运用了先进的致动器和能量回收装置以提高步态安全性和防止跌倒。然而,这些设备需要提供足够的机械功率,以确保踝关节在摆动阶段的背屈辅助。了解踝关节背屈的动力学需求,对设计轻便、低功率的助力设备尤为重要。 论文来源 这篇文章由Victoria University的Soheil Bajelan、...