文章预览
AlphaGo的基本原理 来源:《从AlphaGo的成功说起》 编辑:Gemini 拆开看AlphaGo算法的每个部分,其实都是已有的成熟技术,创新之处是将这些技术进行组合 继 AlphaGo于2015年8月以5-0战胜三届欧洲冠军樊麾、2016年3月以4-1击败世界顶级棋手李世石后,今年1月,AlphGo的升级版本Master横扫各路高手,取得60比0的惊人战绩。20 年前IBM深蓝(Deep Blue)计算机击败国际象棋冠军卡斯帕罗夫的情景还历历在目,短短2年时间,人工智能在围棋领域又创造了人机对抗历史上的新里程碑。 根据谷歌DeepMind团队发表的论文,我们可以窥探到AlphaGo的基本设计思路。任何完全信息博弈都无非是一种搜索。搜索的复杂度取决于搜索空间的宽度(每步的选择多寡)和深度(博弈的步数)。对于围棋,
………………………………