基于情景记忆的双Actor-Critic框架在深度强化学习中的应用

学术背景 深度强化学习(Deep Reinforcement Learning, DRL)在游戏、机器人、导航、计算机视觉和金融等多个领域取得了显著成就。然而,现有的DRL算法普遍存在样本效率低下的问题,即需要大量的数据和训练步骤才能达到理想的性能。尤其是在连续动作任务中,由于状态-动作空间的高维性,传统的DRL算法难以有效利用情景记忆(Episodic Memory)来指导动作选择,导致样本效率进一步降低。 情景记忆是一种非参数控制方法,通过记忆高回报的历史经验来提升样本效率。在离散动作任务中,情景记忆可以直接用于评估每个可能的动作,并选择估计值最高的动作。然而,在连续动作任务中,动作空间是无限的,传统的情景记忆方法难以直接应用于动作选择。因此,如何在连续动作任务中有效利用情景记忆来提升样...

增强的预刺激θ和α振荡预示着跨模态联想的成功编码

增强跨模态记忆编码前的θ波和α波振荡增加 背景介绍 情景记忆(episodic memory)是人类记忆的重要组成部分,其核心机制之一是通过不同感觉通道的刺激形成联想。然而,目前的理论认为,在跨模态(crossmodal)联想编码过程中,θ波(theta band,3-7 Hz)振荡的相位和功率起着功能性的作用。此外,若在刺激呈现前在θ波范围内(3-7 Hz)以及α波范围内(8-12 Hz)和低β波范围内(13-20 Hz)持续存在振荡活动,这对随后的记忆过程和认知处理有着调节作用。 研究课题 本研究旨在测试这样一个假设:前刺激的低频活动特性对成功形成跨模态记忆是相关的。研究设计特意用于独立于单个项目记忆而调查连带记忆。参与者需要记住视听刺激对并在随后的识别任务中分辨它们和重新排列的新配对。...