エピソードメモリダブルアクタークリティックツインディレイドディープデターミニスティックポリシーグラディエント

学術的背景 深層強化学習(Deep Reinforcement Learning, DRL)は、ゲーム、ロボット、ナビゲーション、コンピュータビジョン、金融など、さまざまな分野で顕著な成果を上げています。しかし、既存のDRLアルゴリズムは、一般的にサンプル効率が低いという問題を抱えています。つまり、理想的な性能を達成するためには、大量のデータとトレーニングステップが必要です。特に連続動作タスクでは、状態-アクション空間の高次元性により、従来のDRLアルゴリズムはエピソード記憶(Episodic Memory)を効果的に活用してアクション選択を導くことが難しく、サンプル効率がさらに低下します。 エピソード記憶は、非パラメトリック制御手法の一つであり、高報酬の履歴経験を記憶することでサンプル効率...

監視ビデオにおける異常行動検出のための確率的メモリオートエンコーディングネットワーク

監視ビデオにおける異常行動検出のための確率的メモリオートエンコーディングネットワーク

確率メモリオートエンコーディングネットワークを用いた監視カメラ映像の異常行動検出研究 学術的背景 インテリジェント監視システムにおいて、異常行動検出は、テロ対策、社会の安定維持、公共の安全確保など、極めて重要な機能です。しかし、異常行動検出には核心的な課題があります。それは、通常の行動データと異常行動データの極端な不均衡です。通常の行動データは大量に入手可能ですが、異常行動データは少なく、予測が困難です。この不均衡により、従来の教師あり学習手法では効果的なモデルの訓練が難しくなっています。そのため、大量の通常行動データを活用して通常行動の分布をモデル化し、それに基づいて異常行動を検出する方法の研究が重要な方向性となっています。 近年、深層学習に基づく手法が異常行動検出において顕著な進展を遂げ...

制限付きボルツマンマシンにおけるデータセットフリーの重み初期化

統計力学的分析に基づく制限付きボルツマンマシンの重み初期化手法の研究 学術的背景 深層学習において、ニューラルネットワークの重み初期化はモデルの学習効果に大きな影響を与えます。特に、フィードフォワードニューラルネットワーク(feed-forward neural networks)では、LeCun、Xavier(またはGlorot)、He初期化など、データセットに依存しない重み初期化手法が提案されています。これらの手法は、特定の分布(例えばガウス分布や一様分布)に基づいて重みパラメータの初期値をランダムに決定し、トレーニングデータセットを使用しません。しかし、制限付きボルツマンマシン(Restricted Boltzmann Machine, RBM)では、同様の重み初期化手法はまだ開発され...

視覚と言語の統合によるゼロショット人-物相互作用検出に向けて

視覚と言語の統合によるゼロショット人-物相互作用検出に向けて

視覚-言語統合に基づくゼロショット人間-物体相互作用検出研究 学術的背景 人間-物体相互作用(Human-Object Interaction, HOI)検出は、コンピュータビジョン分野における重要な研究テーマであり、画像内の人間と物体の間の相互作用を識別することを目的としています。従来のHOI検出手法は主に教師あり学習に依存しており、大量の人手によるアノテーションデータを用いてモデルを訓練する必要があります。しかし、この手法は未見の物体カテゴリに対して汎化能力が限られています。さらに、現実世界における人間-物体相互作用は多様で複雑であり、すべての可能な相互作用カテゴリを手動でアノテーションすることは時間と労力がかかります。 近年、視覚-言語モデル(Vision-Language Model...

PrivCore:効率的なプライベート推論のための乗算-活性化共約

深層ニューラルネットワークにおける効率的なプライバシー推論:PrivCoreフレームワークの画期的研究 背景紹介 深層学習技術の急速な発展に伴い、深層ニューラルネットワーク(Deep Neural Networks, DNNs)は画像認識、自然言語処理、医療診断などの分野でますます広く応用されています。しかし、データプライバシーとモデル保護のニーズが高まる中、ユーザーのプライバシーを保護しながら効率的なモデル推論を行う方法が重要な研究課題となっています。従来のプライバシー保護推論手法、例えば安全な多者間計算(Secure Multi-Party Computation, MPC)に基づくプライバシー推論(Private Inference, PI)は、プライバシー保護の面では優れているものの...

低ランクテンソル空間におけるグローバルプロンプトの学習と異種フェデレーテッドラーニング

学術的背景 人工知能(AI)モデルの複雑化とデータプライバシー保護の必要性が高まる中、連邦学習(Federated Learning, FL)は分散型機械学習のパラダイムとして研究の焦点となっています。連邦学習は、複数のクライアントがローカルデータを共有することなく、グローバルモデルを協調的に訓練することを可能にし、データプライバシーを保護しながらモデルの汎化能力を向上させます。しかし、連邦学習は実際の応用において以下の3つの課題に直面しています:1)モデルパラメータが多すぎるために通信負荷が大きい、2)非独立同分布(Non-IID)データによりグローバルモデルの性能が低下する、3)モデルの異質性により従来の連邦集約方法が機能しない。 これらの問題を解決するため、本論文ではFedGPTという...

グラフ変換器を用いたデュアルビューグラフ表現学習によるグラフレベル異常検出

双視点グラフ・オブ・グラフ表現学習に基づくグラフレベル異常検出研究 学術的背景 現代のデータ駆動型の世界において、グラフ(Graph)は強力なデータ構造として、ソーシャルネットワーク分析、金融詐欺検出、バイオインフォマティクスなどの分野で広く活用されています。グラフは、ソーシャルネットワークにおけるユーザー関係、金融取引における資金の流れ、化学分子における原子と化学結合の関係など、複雑な関係データを効果的に表現することができます。しかし、グラフデータの広範な応用に伴い、大量のグラフデータから異常なグラフサンプル(Graph-Level Anomaly Detection, GLAD)を検出することが重要な研究課題となっています。 既存のGLAD手法は、グラフニューラルネットワーク(Graph...

三段階記憶流制御による知識追跡

学術的背景 人工知能(AI)技術の急速な発展に伴い、Khan AcademyやCourseraなどのインテリジェント教育システム(Intelligent Tutoring Systems, ITS)は、個別化学習において顕著な進展を遂げています。知識追跡(Knowledge Tracing, KT)は、ITSの中核技術として、学生の学習データを分析し、その知識習得状況を推測し、将来の学習パフォーマンスを予測することを目的としています。近年、KT分野では多くの進展がありましたが、既存のモデルは記憶構造のシミュレーションにおいて不十分であり、学生の顕在的な学習と潜在的な記憶変換の間に不一致が生じています。この問題を解決するため、華中師範大学などの研究チームは、記憶フロー制御に基づく三段階の知識追...

高次運動フローによる共役視覚表現の継続的学習

高次運動フローを利用した共役視覚表現の継続的学習:CMOSFETモデルの研究 学術的背景 人工知能とコンピュータビジョンの分野において、連続的な視覚データストリームからの継続的学習(Continual Learning)は長年の課題です。従来の機械学習手法は、独立同分布(i.i.d.)の仮定に依存しており、すべての訓練データが訓練時に静的かつ利用可能であることを前提としています。しかし、現実世界の視覚データは連続的で非独立同分布であることが多く、モデルの訓練に大きな困難をもたらします。さらに、既存の教師なし学習手法の多くは大規模なオフライン訓練データセットに依存しており、これは人間や動物が環境を連続的に体験しながら学習する方法とは大きく異なります。 これらの問題を解決するため、Simone ...

相互アンカーコントラスト学習を活用した少数ショット関係抽出の研究

インスタンス-ラベルダイナミクスを活用した相互アンカーコントラスト学習による少数ショット関係抽出 学術的背景 自然言語処理(Natural Language Processing, NLP)の分野において、関係抽出(Relation Extraction, RE)は、テキストからエンティティ間の関係を識別し抽出するための基本的なタスクです。しかし、従来の教師あり学習手法は大量のアノテーションデータに依存しており、実際の応用ではアノテーションデータの不足がモデルの性能を大きく制約しています。この課題に対応するため、少数ショット関係抽出(Few-Shot Relation Extraction, FSRE)が登場し、少量のアノテーションデータでモデルを訓練し、限られたサンプルでも正確にエンティテ...