专栏名称: 慢慢学 AIGC
关注 AIGC,LLM,AI infra 等方向最新资讯,欢迎高质量技术类文章投稿,商务合作可联系 Mistake113
目录
相关文章推荐
今天看啥  ›  专栏  ›  慢慢学 AIGC

为什么你(可能)不应该使用强化学习

慢慢学 AIGC  · 公众号  ·  · 2024-06-17 07:50
    

文章预览

点击下方 卡片 ,关注“ 慢慢学AIGC ” 前言 强化学习这项技术引起了很多热议。这是可以理解的...它可能是迈向实现通用人工智能最重要的机器学习进展之一。但除了一般兴趣之外,你可能最终会问到:"它是否适合你的应用程序"? 我目前正在从事一个视觉机器人团队,作为过去的强化学习研究人员,我被问及对于我的团队来说是否应该使用强化学习。 下面,我列出了一些我认为你可能不想在应用程序中使用强化学习的原因,或者至少应该三思而行。 让我们开始吧! 极其嘈杂 下面是一个游戏的两个学习曲线图,该游戏的最高分是500分。那么哪种学习算法更好呢?这是一个陷阱问题。它们是完全相同的,第二次运行只是第一次运行的重复。唯一区别在于,导致一次训练会压倒性地获胜并学习到完美策略,而另一次则彻底失败的,仅仅是随机种子的不同。 小的随机初 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览