ゼロサムゲームのための割引安定適応批評設計とその応用検証

ディスカウント価値反復に基づく適応的批評設計のゼロサムゲームへの応用と検証 研究背景 制御分野において、最適制御(Optimal Control)は重要な研究テーマであり、システムの性能を最適化するための制御システムの設計と分析を目的としています。システムの複雑さが増すにつれて、伝統的なハミルトン-ヤコビ-ベルマン方程式(Hamilton-Jacobi-Bellman, HJB)に基づく最適制御手法は「次元の呪い」(Curse of Dimensionality)という課題に直面しています。この課題に対処するため、研究者たちは適応的動的計画法(Adaptive Dynamic Programming, ADP)を提案し、強化学習(Reinforcement Learning)や関数近似(Fu...

非対称制約ゼロサムゲームのためのニューラルクリティック技術を統合した高度な最適追跡

学術報告:先進最適追跡と神経ネットワーク評価技術の統合による非対称制約ゼロサムゲームの研究 背景と研究課題 現代の制御分野において、ゲーム理論は、少なくとも二人のプレイヤーの相互決定問題を含む、知的意思決定者間の競争と協力を研究する数学モデルである。近年、微分ゲームは制御分野でますます注目を集めている。複雑な外乱システムの最適制御問題に直面する際、通常これをゼロサムゲーム(Zero-Sum Game, ZSG)と見なす。システムの制御問題が異なる制御戦略を含み、外乱がない場合、非ゼロサムゲーム(Non-ZSG)と呼ばれる。しかし、実際のシステムには様々な外乱が存在するため、外乱がシステム性能に与える影響を軽減するために、ZSG問題をさらに考慮することが非常に重要である。 特に連続時間(Con...