汎用可能な神経レンダリングを用いた3D指紋特性認識の改善

FingerNeRFを用いた3D指生体認証に関する研究レビュー 背景と研究の意義 バイオメトリクス技術の発展に伴い、三次元(3D)バイオメトリクスはその高い精度、優れた偽装防止能力、撮影角度の変化に対するロバスト性から、主流な研究分野の一つとなっています。中でも、指紋、静脈、指関節といった生体特徴の取得が容易で広く利用されているため、3D指バイオメトリクスは学術界や産業界で注目されています。しかし、現行の3Dバイオメトリクス手法は主に明示的な3D再構築技術に依存しており、以下の課題に直面しています。 情報の欠落: 明示的な再構築プロセスでは、一部の詳細情報が失われるため、認証タスクのパフォーマンスに直接的な影響を及ぼします。 ハードウェアとアルゴリズムの密結合: 再構築アルゴリズムは特定のハ...

カリキュラム予測を備えたメモリ支援型知識転送フレームワークを用いた弱教師ありオンライン活動検出

研究背景と研究意義 近年、ビデオ理解分野における弱教師ありオンライン活動検出(Weakly Supervised Online Activity Detection, WS-OAD)は、高度なビデオ理解の重要な課題として広く注目されています。この課題の主な目標は、安価なビデオレベルのアノテーションのみを利用して、ストリーミングビデオ内で進行中の活動をフレーム単位で検出することです。このタスクは、自動運転、公共安全監視、ロボットナビゲーション、拡張現実など、多くの実用的な応用分野で重要な価値を持っています。 完全教師あり手法(Fully Supervised Methods)はオンライン活動検出(OAD)で顕著な進展を遂げましたが、フレームレベルの密なアノテーション(Frame-level A...

人物再識別のための動的注意ビジョン・言語トランスフォーマーネットワーク

動的注意機構を持つ視覚言語Transformerネットワークを用いた歩行者再識別に関する研究報告 近年、マルチモーダルベースの歩行者再識別(Person Re-Identification、以下ReID)はコンピュータビジョンの分野で注目を集めています。ReIDは、異なるカメラの視点間で特定の歩行者を識別することを目的としており、行方不明者の捜索や犯罪者の追跡といったセキュリティ・監視アプリケーションにおいて重要な役割を果たします。しかし、マルチモーダルReID技術では、視覚情報とテキスト情報を統合する際に大きな課題が存在し、特に特徴統合の偏りや、モデル性能に影響を与えるドメインギャップ(分布の違い)が問題となっています。 本研究は、江西財経大学コンピュータと人工知能学院およびニューカッスル...

StyleAdapter:統一されたスタイライズド画像生成モデル

StyleAdapter: 統一的なスタイル化画像生成モデル 近年、テキストから画像生成(Text-to-Image, T2I)技術および深層学習モデルの急速な発展により、人工知能による画像生成分野での研究が大きく進展しました。しかし、参照画像の特定のスタイルをテキスト生成された高品質画像に統合することは、いまだに大きな課題です。この課題に対応するため、Zhouxia Wangらは「StyleAdapter」と呼ばれる統一的なスタイル化画像生成モデルを提案しました。本論文は、International Journal of Computer Vision に発表され、香港大学、Tencent ARC Lab、マカオ大学、および上海人工知能研究所の研究者たちによって共同執筆されました。 研究背...

深層顔認識のためのサンプル相関指紋技術

深層顔認識におけるモデル盗用検出と保護:サンプル相関に基づく革新研究 背景と研究課題 近年、深層学習技術の急速な発展により、顔認識分野は飛躍的な進歩を遂げています。しかし、同時に商用顔認識モデルは知的財産権の侵害リスクに直面しています。モデル盗用攻撃は、モデルのブラックボックスまたはホワイトボックスアクセスを通じて、同等の機能を持つモデルを複製することを可能にし、モデル所有者の検出を回避します。このような攻撃は、知的財産権の侵害だけでなく、商業利益やプライバシーの安全性にも深刻な脅威をもたらします。 この課題に対応するために、モデル指紋法が重要な盗用検出手段として注目されています。従来の方法は主に可搬性のある対抗サンプルを利用してモデル指紋を生成しますが、これらの方法は対抗学習や転移学習に対...

低フレームレート動画における多目的トラッキングのための変位不確実性に基づく手法

低フレームレート多目標追跡研究に関する学術報告 序論と研究背景 近年、多目標追跡(MOT:Multi-Object Tracking)技術は、スマートビデオ監視、自動運転、ロボットビジョン分野で広く利用されています。しかし、従来のMOT手法は主に高フレームレートビデオを対象に設計されており、低フレームレートのビデオシナリオでは顕著な課題に直面しています。低フレームレートでは、隣接フレーム間での物体の移動量が増加し、物体の外観や可視性の変化がより激しくなり、検出結果の関連付けやトラックの維持に対してより高い要求が求められます。エッジデバイスは通常、計算、記憶、および伝送帯域幅に制約があるため、低フレームレートビデオは効率的なソリューションとして重要ですが、その技術的課題を解決することが急務です...

アンチフェイクワクチン:視覚と意味の二重劣化を通じて顔の交換からプライバシーを守る

深度偽造と顔プライバシー保護に関する研究: Anti-Fake Vaccine の新しいアプローチ 背景と研究動機 近年、ディープフェイク(Deepfake)技術の進展は、個人のプライバシーおよび社会的安全に対する重大な脅威をもたらしています。ディープフェイク技術の代表的な応用として顔の置き換え技術があり、映画制作やコンピュータゲームなどで広く活用されていますが、その潜在的リスクが次第に顕著になっています。顔の置き換え技術は、元の顔(ソース顔)のアイデンティティ情報をターゲット顔に埋め込むことで、説得力がありながらも欺瞞的な合成画像やビデオを生成します。この技術が普及するにつれて、不正行為者が未承諾のフェイクコンテンツを簡単に作成できるようになり、被害者の名誉や安全が深刻に脅かされています。...

少数の注釈付きピクセルとポイントクラウドに基づく運転シーンの弱教師ありセマンティックセグメンテーション

少量のピクセルラベルと点群データを用いた自動車運転シーンの弱教師ありセマンティックセグメンテーション 背景と研究課題 セマンティックセグメンテーションは、コンピュータビジョンにおける重要な課題の一つであり、自動運転などの分野で広く応用されています。しかし、従来の完全教師ありセグメンテーション手法では、大量のピクセル単位のアノテーションが必要であり、そのコストは非常に高いです。 弱教師ありセグメンテーション(Weakly Supervised Semantic Segmentation、WSSS)は、ラベル付きデータが少ない状況で高精度なセグメンテーションを実現することを目的とし、画像ラベルやバウンディングボックス、点レベルのラベルなどの粗いアノテーションを利用して、ピクセル単位のセグメンテー...

バイオメトリクスデータの誤り訂正のための現代的な深層学習技術の再考

現代のディープラーニング技術における生体データのエラー訂正に関する再考 背景 情報技術の発展に伴い、生体データは認証や安全なデータ保管のための重要な要素として利用されています。従来の暗号技術は、均一分布で再現可能なランダム文字列に依存していましたが、指紋や虹彩スキャンのような生体データはそのような特性を備えておらず、生成・保管・取得に課題を抱えています。こうした課題に対処するため、生体データを暗号鍵の生成元として利用する生体認証暗号システム(biometric cryptosystems)が注目されています。しかし、生体データの変動性や外部要因(センサーのノイズなど)により、暗号鍵の正確な復元が困難となり、エラー訂正メカニズムが重要となります。 近年、ディープラーニング(DL)の進展により、...

日中と夜を超える擬似教師付き活動認識

学術論文報告 研究ハイライト:低照度活動認識のための擬似教師あり学習と適応型音声-映像統合 学術的背景 本研究では、低照度環境での活動認識の課題を中心に取り組んでいます。既存の活動認識技術は、十分な照明条件下では優れた性能を発揮しますが、暗所環境で記録された映像に対してはほとんど機能しません。この制約は主に以下の2つの理由に起因します:1) 訓練用の低照度映像の不足、2) テスト時の視覚情報の損失を引き起こす低照度でのコントラスト低下。また、従来の映像強調に基づく解法では、映像品質が一定程度向上するものの、色歪みや映像フレーム間の不連続性を引き起こし、活動認識タスクに対して逆効果をもたらすことが多いです。 低照度活動認識は、スマートホーム、自動運転、セキュリティ監視、野生動物観察など、多くの...