专栏名称: 新机器视觉
最前沿的机器视觉与计算机视觉技术
今天看啥  ›  专栏  ›  新机器视觉

入门VLA必读:一文整理近年来VLA技术发展趋势

新机器视觉  · 公众号  ·  · 2025-03-26 21:00
    

文章预览

本文汇总了近年来VLA的相关技术文章,文中提到的不少论文仅仅是粗读,不免存在一些理解错误,文中也有不少根据自己理解自由发挥的思考,若读者发现文中谬误,恳请不吝指正。一些我自由发挥成分比较大的部分,会专门用【】标识出来。 我主要目的是 学习相关方法尝试往智驾领域迁移 ,因此可能会有一些跟智驾相关的思考内容穿插进论文分享里。 一、Act 标题: Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware 链接: https://arxiv.org/pdf/2304.13705 单位: 斯坦福大学等 网络主要是一个Conditional VAE。 一般自回归的方案会有一个问题,每次推理都可能有误差,而且这个误差会随着自回归过程累积,越来越大【之前看MotionLM论文时就觉得这种栅格法(分箱法)把动作转token的方案精度损失就很大,当时就觉得推理时误差会随着步长越来越大。】 即使 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览