人物再識別のための動的注意ビジョン・言語トランスフォーマーネットワーク

動的注意機構を持つ視覚言語Transformerネットワークを用いた歩行者再識別に関する研究報告 近年、マルチモーダルベースの歩行者再識別(Person Re-Identification、以下ReID)はコンピュータビジョンの分野で注目を集めています。ReIDは、異なるカメラの視点間で特定の歩行者を識別することを目的としており、行方不明者の捜索や犯罪者の追跡といったセキュリティ・監視アプリケーションにおいて重要な役割を果たします。しかし、マルチモーダルReID技術では、視覚情報とテキスト情報を統合する際に大きな課題が存在し、特に特徴統合の偏りや、モデル性能に影響を与えるドメインギャップ(分布の違い)が問題となっています。 本研究は、江西財経大学コンピュータと人工知能学院およびニューカッスル...