专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
今天看啥  ›  专栏  ›  AI科技评论

强化学习如何真正实现任务自动化?不妨试试「两步走」策略!

AI科技评论  · 公众号  · AI  · 2019-10-07 20:09

文章预览

作者 | Jacob Buckman 编译 | MrBear 编辑 | 丛末 作为行为主义学派的重要技术,近年来,强化学习在 Atari 游戏领域大放异彩。然而,人们要想将强化学习技术真正应用于现实世界任务,还有很长的一段路要走。本文将真实世界强化学习任务抽象为「简化」和「求解」的两个步骤,从马尔科夫决策过程的角度,讨论了基于强化学习的 普适性 自动化技术。 对于广大研究者来说,有朝一日能够在使用很少的人力的情况下,通过强化学习为现实世界中的任务生成自动化的解决方案是梦寐以求的事情1。不幸的是,现在看来,强化学习还很难实现这一目标。到目前为止,深度强化学习基本上还没有解决任何现实世界中的问题;即使是在非常理想的简单情况下,强化学习找到的解决方 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览