先进最优跟踪结合神经网络评价技术用于非对称约束零和博弈

学术报告:先进最优跟踪结合神经网络评价技术用于非对称约束零和博弈 背景与研究问题 在现代控制领域,博弈论是研究智能决策者之间竞争与合作的数学模型,其中涉及至少两个玩家的互动决策问题。近年来,微分博弈在控制领域引起了越来越多的关注。当我们面对复杂受扰动系统的最优控制问题时,通常将其视为零和博弈(Zero-Sum Game, ZSG)。如果某系统的控制问题涉及多种控制策略且无扰动时,则被称为非零和博弈(Non-ZSG)。然而,由于真实系统中常存在各种扰动,因此进一步考虑ZSG问题以减轻扰动对系统性能的影响非常重要。 尤其在连续时间(Continuous-Time, CT)非线性系统中,传统动态规划方法尽管非常有价值,但在解决非线性最优控制问题时,常因为维数灾难(Curse of Dimensio...