把RLHF带给VLA模型！通过偏好对齐来优化机器人策略，代码已开源

机器之心 · 公众号 · AI · 2024-12-27 11:47

文章预览

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com 论文一作为北卡罗来纳大学教堂山分校张子健，指导老师为北卡罗来纳大学教堂山分校助理教授 Huaxiu Yao。共同第一作者为华盛顿大学 Kaiyuan Zheng，其余作者包括来自北卡教堂山的 Mingyu Ding、来自华盛顿大学的 Joel Jang、Yi Li 和Dieter Fox，以及来自芝加哥大学的 Zhaorun Chen、Chaoqi Wang。论文标题：GRAPE: Generalizing Robot Policy via Preference Alignment 论文链接：https://arxiv.org/abs/2411.19309 项目地址：https://grape-vla.github.io 代码地址：https://github.com/aiming-lab/GRAPE 研究背景近年来，视觉-语言 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

国家数据局 · 人工智能专家朱松纯、王海峰到我局进行专题讲座

14 小时前

国家数据局 · 人工智能专家朱松纯、王海峰到我局进行专题讲座

14 小时前

爱可可-爱生活 · 几篇论文实现代码：《Salient Object-Aware B-20241225135631

2 天前

人工智能那点事 · 担心的事发生了！可可西里“网红狼”疑被轧死，曾有人警告……

2 天前

新智元 · MIT、OpenAI等震撼力作：AI首次自主发现人工生命！人类窥见上帝造物

2 天前

爱可可-爱生活 · Grams 优化算法通过巧妙地解耦梯度更新的方向和幅度，并辅以严-20241225054949

3 天前

南风窗 · “网络身份证”要来了，会怎样

4 月前

四川日报 · 最新消息：28人生还，包括1名儿童

2 天前