基于策略共识的分布式确定性多智能体强化学习方法研究

基于策略共识的分布式确定性多智能体强化学习研究报告 强化学习(Reinforcement Learning, RL)近年来在诸多领域取得了显著突破,包括机器人学、智能电网和自动驾驶等。然而,在实际场景中,常常涉及到多智能体(Multi-Agent Reinforcement Learning, MARL)的协作学习问题。这类问题的核心挑战在于设计高效的多智能体协作强化学习算法,尤其是在受制于通信能力限制或隐私保护的情况下。目前,多数的MARL算法依赖一种被广泛采用的集中化训练-分布式执行(Centralized Training with Decentralized Execution, CTDE)范式。该范式虽然可以有效解决环境的非平稳性问题,但由于其重通信和集中化处理的本质,使其在实际部...

异构有向多智能体系统的协作输出调节:一种完全分布式的无模型强化学习框架

异构有向多智能体系统合作输出调节问题研究:基于完全分布式无模型强化学习框架 背景介绍 近年来,分布式控制和优化的研究在智能交通、智能电网、分布式能源系统等领域表现出了广泛的应用前景。这类系统通常需要多个智能体的协作完成特定任务,其中基础性研究课题之一便是合作输出调节问题(Cooperative Output Regulation,简称COR)。该问题旨在通过设计合适的控制协议,使得多智能体系统中的所有智能体都能跟踪参考信号并最终实现零跟踪误差。然而,要解决这类问题,准确获知智能体动态模型的信息通常是现有方法的基本前提,这在现实中由于复杂环境和高度耦合的非线性难以实现,甚至可能导致测量成本过高。 此外,由于多智能体系统的通信网络往往具有方向性(即信息传递非对称性),这进一步加大了研究这一问题的...