ACT—斯坦福具身智能入门梳理

新机器视觉 · 公众号 · · 2025-02-19 11:20

文章预览

0.简介 ALOHA算得上是今年年初很惊艳的具身项目了，其项目网站: https://mobile-aloha.github.io/ 。而ACT模仿学习算法能够有效处理复合误差，通过动作分块和时间集成减少任务的有效范围，缓解模仿学习中的复合误差问题，提高了在精细操作任务中的性能。将策略训练为条件变分自编码器（CVAE），能够更好地对有噪声的人类演示数据进行建模，准确预测动作序列。实验证明在多个模拟和真实世界的精细操作任务中显著优于之前的模仿学习算法。我们主要的代码可以在 https://github.com/tonyzhaozh/act 或者 https://github.com/MarkFzp/act-plus-plus 看到并学习。 1. ACT原理 ACT作为斯坦福最新的Mobile ALOHA系统的最核心的算法：Action Chunking with Transformer。它为啥效果这么好，其实主要的就是Transformer生成式算法，在ACT中主要使用的是CVAE，下面我们就AE（自动编码器）、VAE（变 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博