人物再識別のための動的注意ビジョン・言語トランスフォーマーネットワーク

動的注意機構を持つ視覚言語Transformerネットワークを用いた歩行者再識別に関する研究報告 近年、マルチモーダルベースの歩行者再識別(Person Re-Identification、以下ReID)はコンピュータビジョンの分野で注目を集めています。ReIDは、異なるカメラの視点間で特定の歩行者を識別することを目的としており、行方不明者の捜索や犯罪者の追跡といったセキュリティ・監視アプリケーションにおいて重要な役割を果たします。しかし、マルチモーダルReID技術では、視覚情報とテキスト情報を統合する際に大きな課題が存在し、特に特徴統合の偏りや、モデル性能に影響を与えるドメインギャップ(分布の違い)が問題となっています。 本研究は、江西財経大学コンピュータと人工知能学院およびニューカッスル...

可視光と赤外線の人物再識別のための適応的中間モダリティ整合学習

可視光と赤外線の人物再識別のための適応的中間モダリティ整合学習

可視光と赤外線を用いたクロスモダリティ学習に基づくAdaptive Middle-Modality Alignment Learning手法の研究 研究背景と課題 スマート監視システムの需要に伴い、可視光と赤外線を利用した人物再識別(Visible-Infrared Person Re-identification, VIReID)は注目を集める研究分野となっています。本課題は、異なるスペクトルモダリティ(可視光と赤外線)に基づいた人物画像をマッチングさせ、24時間対応の人物識別を実現することを目的としています。可視光画像と赤外線画像は異なる光スペクトルから生成されるため、照明、テクスチャ、色などに大きなモダリティ差が存在し、このクロスモダリティマッチングが大きな課題となっています。 従来の...