【ICML2024】深度强化学习中的随机潜在探索

数据派THU · 公众号 · 大数据 · 2024-07-28 17:00

文章预览

来源：专知本文为论文介绍，建议阅读 5 分钟本文介绍了一种名为随机潜在探索（Random Latent Exploration，RLE）的新探索技术。高效探索高维状态空间的能力对于深度强化学习（RL）的实际成功至关重要。本文介绍了一种名为随机潜在探索（Random Latent Exploration，RLE）的新探索技术，该技术结合了奖励加成和噪声加成（两种深度RL中有效探索的流行方法）的优势。RLE利用了通过在环境的某些（随机）状态中向原始任务奖励添加结构化随机奖励来扰动奖励的想法，以鼓励代理在训练过程中探索环境。RLE实现简单，实践效果良好。为了展示RLE的实际有效性，我们在具有挑战性的ATARI和ISAACGYM基准上进行了评估，结果表明RLE在所有任务中表现出的总体得分高于其他方法。关于我们数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博