信息受限环境中的自模型自由学习与外部奖励学习对比研究
自模型自由学习与有外部奖励学习在信息受限环境中的对比:一种新的强化学习框架 近年来,随着网络和人工智能系统的发展,网络化学习机制受到显著的安全挑战。在强化学习(Reinforcement Learning, RL)领域,奖励信号丧失、数据包丢失以及故意的网络攻击已成为影响学习系统性能的重要障碍。针对这一问题,来自乔治亚理工学院的Prachi Pratyusha Sahoo(IEEE学生会员)和Kyriakos G. Vamvoudakis(IEEE高级会员)提出了一种依靠内部奖励信号的新型强化学习框架,称为“自模型无学习”(Self-Model-Free RL)。本文发表于2024年12月《IEEE Transactions on Artificial Intelligence》,展示了在奖...