动态注意视觉-语言Transformer网络在人员重新识别中的应用
动态注意力视觉语言Transformer网络用于行人再识别的研究报告 近年来,基于多模态的行人再识别(Person Re-Identification, ReID)技术在计算机视觉领域受到越来越多的关注。行人再识别旨在通过跨摄像机视角识别特定行人,是安全与监控应用(如寻找失踪人员、追踪犯罪分子)的关键技术。然而,多模态ReID技术融合视觉和文本信息时面临重大挑战,包括特征融合的偏差以及领域差异对模型性能的影响。 本文由Guifang Zhang、Shijun Tan、Zhe Ji和Yuming Fang等人撰写,来自江西财经大学计算与人工智能学院及纽卡斯尔大学纽卡斯尔商学院,发表于2024年《International Journal of Computer Vision》。研究提出了一种动...