专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

【微信AI】深度强化学习系列四：状态空间的泛化和DQN

新智元 · 公众号 · AI · 2017-05-04 14:44

文章预览

新智元推荐来源：微信AI 授权转载作者：叶浩新智元启动 2017 最新一轮大招聘： COO、总编、主笔、运营总监、视觉总监等８大职位全面开放。新智元为COO和执行总编提供最高超百万的年薪激励；为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元，与人工智能业界领袖携手改变世界。简历投递：j obs@aiera.com.cn HR 微信： 13552313024 【新智元导读】本文将详细解读深度强化学习中的状态空间的泛化和DQN。这些都是DeepMind引以为傲的技术。 Q-Learning回顾上一章我们讲到了可以用时域差分的学习方法，进行Q-Learning来求解最优的策略。 1）假设我们进行了很多试验，每次的表达是 (s, a, r, s’, a’, r’, s’ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博