ポリシーコンセンサスベースの分散型決定論的マルチエージェント強化学習

戦略合意に基づく分散型決定性マルチエージェント強化学習研究レポート 強化学習(Reinforcement Learning, RL)は近年、ロボティクス、スマートグリッド、自動運転などの多くの分野で顕著な進展を遂げています。しかし、現実のシナリオでは、マルチエージェント(Multi-Agent Reinforcement Learning, MARL)の協調学習がしばしば要求されます。このような問題の中心的な課題は、通信能力の制約やプライバシー保護の条件下で、効率的なマルチエージェント協調強化学習アルゴリズムを設計することです。現在の多くのMARLアルゴリズムは、広く使用されている集中型訓練-分散型実行(Centralized Training with Decentralized Exec...