文章预览
点击下方 卡片 ,关注“ 慢慢学AIGC ” 前言 强化学习这项技术引起了很多热议。这是可以理解的...它可能是迈向实现通用人工智能最重要的机器学习进展之一。但除了一般兴趣之外,你可能最终会问到:"它是否适合你的应用程序"? 我目前正在从事一个视觉机器人团队,作为过去的强化学习研究人员,我被问及对于我的团队来说是否应该使用强化学习。 下面,我列出了一些我认为你可能不想在应用程序中使用强化学习的原因,或者至少应该三思而行。 让我们开始吧! 极其嘈杂 下面是一个游戏的两个学习曲线图,该游戏的最高分是500分。那么哪种学习算法更好呢?这是一个陷阱问题。它们是完全相同的,第二次运行只是第一次运行的重复。唯一区别在于,导致一次训练会压倒性地获胜并学习到完美策略,而另一次则彻底失败的,仅仅是随机种子的不同。 小的随机初
………………………………