主要观点总结
Figure推出人形视觉-语言-动作模型Helix,实现机器人像人一样推理和操控。Helix能让机器人感知、语言理解、学习控制,是端到端的通用模型。无需特定微调,就能控制机器人执行各种复杂任务。此外,Helix还具有零样本学习能力,能同时操控两台机器人完成协作任务。在家庭中,Helix能帮助机器人适应各种家庭环境,完成捡取物品、操作家电等任务。
关键观点总结
关键观点1: Helix模型介绍
Helix是人形视觉-语言-动作模型,可以实现机器人的感知、语言理解、学习控制等功能。
关键观点2: Helix的能力
Helix能让机器人执行各种复杂任务,包括拿起任何物品、操作家电、完成协作任务等。它还具有零样本学习能力,能处理从未见过的物品。
关键观点3: Helix的训练方式
Helix采用完全端到端的训练方式,将原始像素和文本命令映射到连续动作。它使用标准回归损失,不需要任务特定的适配。
关键观点4: Helix的优势
Helix具有精细化VLA全上半身控制、多机器人协调、零样本学习等多种能力。相比其他机器人系统,Helix使用单一统一模型就能完成各种任务的出色表现。
关键观点5: 未来展望
随着Helix规模的扩大,研究人员期待着它在人形机器人行为能力方面取得更大的突破性进展。
文章预览
新智元报道 编辑:编辑部 【新智元导读】 就在刚刚,Figure祭出首个人形视觉-语言-动作模型Helix。机器人学会像人一样推理,听从自然语言丝滑拿起任何物体。破纪录的是,这个AI能够首次同时操控两台机器人,让它们「共脑」合作!网友:不寒而栗。 与OpenAI分手之后,Figure自研首个模型终于交卷了! 不用ChatGPT,Figure直接把视觉-语言-动作模型(VLA)——Helix装入人形机器人大脑。 它可以让机器人感知、语言理解、学习控制,是一个端到端的通用模型。 果然,Figure的一大目标,就是发展家庭机器人。为此,其内部的AI需要像人一样推理,需要处理任何家庭用品。 「机器人若不实现能力上的飞跃,将无法进入家庭领域」 目前,Helix还主要用于Figure上半身控制,包括手腕、头、单个手指、甚至躯干,能以高速率执行复杂任务。 只需一句话,机
………………………………