专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
目录
今天看啥  ›  专栏  ›  新智元

【微信AI】深度强化学习系列四:状态空间的泛化和DQN

新智元  · 公众号  · AI  · 2017-05-04 14:44
    

文章预览

    新智元推荐   来源: 微信AI 授权转载 作者:叶浩   新智元启动 2017 最新一轮大招聘:   COO、总编、主笔、运营总监、视觉总监等8大职位全面开放 。 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、 高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 简历投递:j obs@aiera.com.cn     HR 微信: 13552313024 【新智元导读】 本文将详细解读深度强化学习中的状态空间的泛化和DQN。这些都是DeepMind引以为傲的技术。 Q-Learning回顾 上一章我们讲到了可以用时域差分的学习方法,进行Q-Learning来求解最优的策略。 1) 假设我们进行了很多试验,每次的表达是 (s, a, r, s’, a’, r’, s’ ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览