今天看啥  ›  专栏  ›  机器之心

魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令

机器之心  · 公众号  · AI  · 2025-04-12 12:57
    

文章预览

机器之心报道 编辑:泽南、杨文 人和智能体共享奖励参数,这才是强化学习正确的方向? 大模型驱动的 AI 助手又升级了。本周五,科技圈正在围观一个陪你一起玩《我的世界》的 AI。 它话不多说,就是埋头干活。一起盖房子的时候,你不需要给 AI 一张蓝图,或是不断告诉它该怎么做,你只需要盖自己的,它就能一边观察一遍配合,并观察你的意图随时改变计划。 现在,AI 可以不断主动学习、纠正错误,展现出了此前大模型智能体无法实现的一系列能力。 看起来,新版的 AI 在与我们共同游戏时不再是催一下动一下了,它已经是一个有「主观能动性」的玩家,就像个和你共同玩过几百局游戏的老友一样。 这项技术名为 AssistanceZero,出自加州大学伯克利分校(UC Berkeley)。值得注意的是,它并未接受大模型常见的 RLHF 训练。相反,它是由「assistance ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览