专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
今天看啥  ›  专栏  ›  人工智能学家

谷歌新智能体Dreamer将亮相NeurIPS 2019,数据效率比前身PlaNet快8个小时

人工智能学家  · 公众号  · AI  · 2019-12-11 20:32

文章预览

来源: 雷锋网 在具有挑战性的环境中,一些人工智能系统通过利用过去经验所提供的世界表象来实现目标。 研究人员将这些应用推广到新的情况,使它们能够在以前从未遇到过的环境中完成任务。 事实证明,强化学习——一种使用奖励来推动软件策略朝着目标前进的训练技术——特别适合学习总结agent经验的世界模型,并通过扩展来促进新行为的学习。 近日,来自Google、Alphabet子公司DeepMind和多伦多大学的研究人员发表了一篇名为《梦想控制: 通过潜意识的学习行为》的新研究,他们开发了一个增强型学习智能体Dreamer,通过内化一个世界模型,并通过通过潜在的“想象力”来提前计划选择行动。 他们说,Dreamer不仅适用于任何学习目标,而且在数据效率、计算时间 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览