人物再識別のための動的注意ビジョン・言語トランスフォーマーネットワーク

動的注意機構を持つ視覚言語Transformerネットワークを用いた歩行者再識別に関する研究報告 近年、マルチモーダルベースの歩行者再識別(Person Re-Identification、以下ReID)はコンピュータビジョンの分野で注目を集めています。ReIDは、異なるカメラの視点間で特定の歩行者を識別することを目的としており、行方不明者の捜索や犯罪者の追跡といったセキュリティ・監視アプリケーションにおいて重要な役割を果たします。しかし、マルチモーダルReID技術では、視覚情報とテキスト情報を統合する際に大きな課題が存在し、特に特徴統合の偏りや、モデル性能に影響を与えるドメインギャップ(分布の違い)が問題となっています。 本研究は、江西財経大学コンピュータと人工知能学院およびニューカッスル...

深層顔認識のためのサンプル相関指紋技術

深層顔認識におけるモデル盗用検出と保護:サンプル相関に基づく革新研究 背景と研究課題 近年、深層学習技術の急速な発展により、顔認識分野は飛躍的な進歩を遂げています。しかし、同時に商用顔認識モデルは知的財産権の侵害リスクに直面しています。モデル盗用攻撃は、モデルのブラックボックスまたはホワイトボックスアクセスを通じて、同等の機能を持つモデルを複製することを可能にし、モデル所有者の検出を回避します。このような攻撃は、知的財産権の侵害だけでなく、商業利益やプライバシーの安全性にも深刻な脅威をもたらします。 この課題に対応するために、モデル指紋法が重要な盗用検出手段として注目されています。従来の方法は主に可搬性のある対抗サンプルを利用してモデル指紋を生成しますが、これらの方法は対抗学習や転移学習に対...

低フレームレート動画における多目的トラッキングのための変位不確実性に基づく手法

低フレームレート多目標追跡研究に関する学術報告 序論と研究背景 近年、多目標追跡(MOT:Multi-Object Tracking)技術は、スマートビデオ監視、自動運転、ロボットビジョン分野で広く利用されています。しかし、従来のMOT手法は主に高フレームレートビデオを対象に設計されており、低フレームレートのビデオシナリオでは顕著な課題に直面しています。低フレームレートでは、隣接フレーム間での物体の移動量が増加し、物体の外観や可視性の変化がより激しくなり、検出結果の関連付けやトラックの維持に対してより高い要求が求められます。エッジデバイスは通常、計算、記憶、および伝送帯域幅に制約があるため、低フレームレートビデオは効率的なソリューションとして重要ですが、その技術的課題を解決することが急務です...

日中と夜を超える擬似教師付き活動認識

学術論文報告 研究ハイライト:低照度活動認識のための擬似教師あり学習と適応型音声-映像統合 学術的背景 本研究では、低照度環境での活動認識の課題を中心に取り組んでいます。既存の活動認識技術は、十分な照明条件下では優れた性能を発揮しますが、暗所環境で記録された映像に対してはほとんど機能しません。この制約は主に以下の2つの理由に起因します:1) 訓練用の低照度映像の不足、2) テスト時の視覚情報の損失を引き起こす低照度でのコントラスト低下。また、従来の映像強調に基づく解法では、映像品質が一定程度向上するものの、色歪みや映像フレーム間の不連続性を引き起こし、活動認識タスクに対して逆効果をもたらすことが多いです。 低照度活動認識は、スマートホーム、自動運転、セキュリティ監視、野生動物観察など、多くの...

高効率デレイン+: 高効率のデレインのためのRainMix拡張による不確実性認識フィルタリングの学習

高効率画像除雨手法:RainMix増強を活用した高効率深層除雨ネットワーク 背景紹介 降雨は、コンピュータビジョンシステムによってキャプチャされた画像や動画の品質に大きな影響を与えます。雨滴や雨筋は画像の鮮明さを低下させ、歩行者検出、物体追跡、セマンティックセグメンテーションなどのタスクに悪影響を及ぼします。全天候対応の視覚システムを実現するためには、画像除雨が重要な要件となります。 しかしながら、従来の除雨手法は雨モデルの経験的仮定に基づいており、複雑な最適化または反復解法を必要とするため、計算コストが高く、リアルタイム性に欠けます。また、これらの仮定は実際の雨景の複雑な多様性を十分にカバーできず、除雨品質を制約します。 この問題を解決するために、本研究では、除雨問題を予測フィルタリング問...

局所アフィンコンセンサスを用いたグラフクラスタリングによる特徴マッチング

グラフクラスタリングに基づく特徴マッチングの研究:局所アフィンコンセンサスの実現と応用 学術的背景と研究動機 特徴マッチングは、コンピュータビジョン分野における基盤的な問題であり、3次元再構成、画像検索、画像登録、SLAM(Simultaneous Localization and Mapping)など、多くのタスクにおいて重要な役割を果たしています。しかし、実際の応用においては、特徴マッチングはノイズ、外れ値(アウトライア)、および様々な画像変換の影響を受け、正確な対応関係を構築することが困難です。グラフモデルに基づく現在の特徴マッチング手法は、その強力な構造表現能力により、これらの問題をある程度解決しますが、以下の課題が残されています: グラフマッチング問題は一般にNP困難であり、計算複...

ターゲットからソースへの引き込み:ドメイン適応型セマンティックセグメンテーションの新しい視点

ドメイン適応セマンティックセグメンテーションにおける新たな視点:T2S-DAの研究 背景と研究の重要性 セマンティックセグメンテーションは、コンピュータビジョン分野において重要な応用を持つが、その性能は大量のアノテーションデータに依存することが多い。しかし、アノテーションデータの収集は特に複雑なシーンでは非常にコストが高いため、多くの研究がアノテーション要件を軽減するために合成データの利用に注目している。しかし、ドメイン間のギャップ(domain gap)の存在により、合成データで学習されたモデルが現実のシナリオに一般化するのは難しい。このような状況で、無教師ドメイン適応(Unsupervised Domain Adaptation, UDA)手法がこの問題を解決するための効果的なアプローチ...

CNNにおける帰属マップの信頼性評価:摂動ベースのアプローチ

深層学習の解釈可能性研究:摂動に基づく帰属マップ評価手法 背景と研究動機 深層学習モデルは多くのタスクで顕著な成功を収めていますが、これらのモデルの解釈可能性と透明性への関心が高まっています。特に、モデルの高精度な予測と同時に、その意思決定プロセスを人間が直感的に理解できるようにする能力が不足しています。この欠如は、多くの実世界のアプリケーションにおけるモデルの採用を制限しています。 コンピュータビジョン分野では、帰属法(Attribution Methods)が神経ネットワークの解釈可能性研究に広く利用されています。これらの方法は、入力画像中のどの領域がモデルの意思決定に最も寄与しているかを示す帰属マップ(Attribution Maps、AMs)を生成します。しかし、帰属マップの定性的性...

オブジェクト再識別のためのトランスフォーマー:調査

オブジェクト再識別のためのTransformer: サーベイ 背景と研究の重要性 オブジェクト再識別(Object Re-Identification、以下Re-ID)は、特定のオブジェクトを異なる時間やシーンで識別する重要なコンピュータビジョンタスクです。本分野は、畳み込みニューラルネットワーク(Convolutional Neural Networks, CNNs)をベースとした深層学習技術により大きな進展を遂げました。しかし、視覚Transformerの登場により、Re-ID研究は新たな局面を迎えています。本研究では、Transformerを用いたRe-ID技術を体系的にレビューし、画像/ビデオ、少データ/少アノテーション、多モーダル、特殊な応用シナリオでの利点と課題を分析します。 研...

Pound–Drever–Hallフィードフォワード:フィードバックを超えたレーザー位相雑音の抑制

特集報道:Pound–Drever–Hall前方フィード技術:フィードバックを超えるレーザー位相ノイズ抑制 著者: Yu-Xin Chao, Zhen-Xing Hua, Xin-Hui Liang, Zong-Pei Yue, Li You, Meng Khoon Tey 機関: 低次元量子物理国家重点実験室、物理学部、清華大学、北京、中国 ジャーナル: Optica 公開日: 2024年7月9日 DOIリンク: ここをクリック 一、研究背景 過去数十年間、超安定光学参考キャビティにロックされた狭線幅レーザーの出現は、重力波検出、光学時計、超低ノイズ光子マイクロ波生成、高忠実度の原子量子ビット制御、超冷分子のコヒーレント合成、暗黒物質及び基本定数の変化の探査など、革新的な技術の先駆けとなり...