为什么你(可能)不应该使用强化学习

慢慢学 AIGC · 公众号 · · 2024-06-17 07:50

文章预览

点击下方卡片，关注“ 慢慢学AIGC ” 前言强化学习这项技术引起了很多热议。这是可以理解的...它可能是迈向实现通用人工智能最重要的机器学习进展之一。但除了一般兴趣之外,你可能最终会问到:"它是否适合你的应用程序"? 我目前正在从事一个视觉机器人团队,作为过去的强化学习研究人员,我被问及对于我的团队来说是否应该使用强化学习。下面,我列出了一些我认为你可能不想在应用程序中使用强化学习的原因,或者至少应该三思而行。让我们开始吧! 极其嘈杂下面是一个游戏的两个学习曲线图,该游戏的最高分是500分。那么哪种学习算法更好呢?这是一个陷阱问题。它们是完全相同的,第二次运行只是第一次运行的重复。唯一区别在于,导致一次训练会压倒性地获胜并学习到完美策略,而另一次则彻底失败的,仅仅是随机种子的不同。小的随机初 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博