强化学习如何真正实现任务自动化？不妨试试「两步走」策略！

AI科技评论 · 公众号 · AI · 2019-10-07 20:09

文章预览

作者 | Jacob Buckman 编译 | MrBear 编辑 | 丛末作为行为主义学派的重要技术，近年来，强化学习在 Atari 游戏领域大放异彩。然而，人们要想将强化学习技术真正应用于现实世界任务，还有很长的一段路要走。本文将真实世界强化学习任务抽象为「简化」和「求解」的两个步骤，从马尔科夫决策过程的角度，讨论了基于强化学习的普适性自动化技术。对于广大研究者来说，有朝一日能够在使用很少的人力的情况下，通过强化学习为现实世界中的任务生成自动化的解决方案是梦寐以求的事情1。不幸的是，现在看来，强化学习还很难实现这一目标。到目前为止，深度强化学习基本上还没有解决任何现实世界中的问题；即使是在非常理想的简单情况下，强化学习找到的解决方 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【SurfSense：个人 AI 助手，旨在帮助网络浏览者记录和-20240930142025

4 天前

爱可可-爱生活 · 提出MaskLLM，一种可学习的方法，用于在大型语言模型中建立N-20240930055057

5 天前

黄建同学 · 阿里推出的这个MIMO必须了解一下↓#ai##科技# 有点像VI-20240929091503

6 天前

爱可可-爱生活 · 提出一种无嵌入的图像生成模型 MaskBit，可以直接对比特标记-20240929060029

6 天前

爱可可-爱生活 · [CL] A Comprehensive Survey of B-20240927054009

1 周前

创业家 · 奶茶价格战，杀伤加盟店

1 月前