专栏名称: APPSO
让智能手机更好用的秘密。
今天看啥  ›  专栏  ›  APPSO

刚刚,前华为天才少年发布首个通用具身基座模型!机器人看视频就能学习做家务

APPSO  · 公众号  · app  · 2025-03-10 11:27
    

文章预览

刚刚,智元发布首个通用具身基座模型——智元启元大模型(Genie Operator-1)。 GO-1 是一个通过观看人类操作视频,让机器人像人类一样学习和执行各种任务的 AI 系统。 它提出了一种名为 ViLLA 的架构,主要由 VLM(多模态大模型)和 MoE(混合专家)组成: 1️⃣ VLM:通过互联网上的大量图片和文字数据,让机器人能看懂场景和理解语言指令。 2️⃣ Latent Planner(隐式规划器):MoE 中的 Latent Planner 通过分析人类操作的视频,学会了怎么规划动作。 3️⃣ Action Expert(动作专家):MoE 中的 Action Exper 通过真实的机器人操作数据,学会了怎么精确地执行动作,比如拿起东西、倒水等。 这三部分配合起来,让机器人可以像人类一样学习和执行任务。测试结果显示,GO-1 的表现比之前的最好模型强很多。 比如在「倒水」、「清理桌面」和「补充饮料」这些任务上,成 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览