今天看啥  ›  专栏  ›  机器之心

业界 | OpenAI 新研究:通过自适应参数噪声提升强化学习性能

机器之心  · 公众号  · AI  · 2017-07-28 12:27
选自OpenAI机器之心编译参与:黄小天、路雪、李泽南OpenAI 的研究人员发现,改善强化学习算法参数中的自适应噪声性能可以提升性能。这种探索方式易于实现,同时很少降低系统表现,因此值得一试。代码地址:https://github.com/openai/baselines 参数噪声可以帮助算法更有效地探索周围的环境,思考所有可能的动作。在经过 216 次 DDPG 无噪声的训练迭代之后,模型将会变得效率低下,而加入参数噪声的训练方法将会让模型的的效果大大提升。参数噪声可以让我们更快地教会人工智能代理执行任务。在 HalfCheetahGym 环境中(如上图)训练 20 次之后,加入噪声的模型可以达到 3000 分左右的水平,而与之对比的普通模型只能保持在 1500 分左右。参数噪声将自适应噪声 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照