专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
今天看啥  ›  专栏  ›  机器之心

不只是围棋!AlphaGo Zero之后DeepMind推出泛化强化学习算法AlphaZero

机器之心  · 公众号  · AI  · 2017-12-07 00:18
    

文章预览

选自arXiv 作者:David Silver等 机器之心编译 在 DeepMind 发表 Nature 论文介绍 AlphaGo Zero 之后,这家公司一直在寻求将这种强大算法泛化到其他任务中的可能性。昨天,AlphaGo 研究团队提出了 AlphaZero:一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法。据称,新的算法经过不到 24 小时的训练后,可以在国际象棋和日本将棋上击败目前业内顶尖的计算机程序(这些程序早已超越人类世界冠军水平),也可以轻松击败训练 3 天时间的 AlphaGo Zero。AlphaZero 为何如此强大?机器之心对论文全文进行了编译介绍,希望能以此带你一探究竟。 8 个小时训练击败李世石版本AlphaGo 12 小时训练击败世界顶级的国际象棋程序 Stockfish 14小时训练击败世界顶 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览