专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

【ICML2024】深度强化学习中的随机潜在探索

数据派THU  · 公众号  · 大数据  · 2024-07-28 17:00

文章预览

来源:专知 本文 为论文介绍 ,建议阅读 5 分钟 本文介绍了一种名为随机潜在探索(Random Latent Exploration,RLE)的新探索技术。 高效探索高维状态空间的能力对于深度强化学习(RL)的实际成功至关重要。 本文介绍了一种名为随机潜在探索(Random Latent Exploration,RLE)的新探索技术 ,该技术结合了奖励加成和噪声加成(两种深度RL中有效探索的流行方法)的优势。RLE利用了通过在环境的某些(随机)状态中向原始任务奖励添加结构化随机奖励来扰动奖励的想法,以鼓励代理在训练过程中探索环境。RLE实现简单,实践效果良好。为了展示RLE的实际有效性,我们在具有挑战性的ATARI和ISAACGYM基准上进行了评估,结果表明RLE在所有任务中表现出的总体得分高于其他方法。 关于我们 数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览