今天看啥  ›  专栏  ›  机器之心

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

机器之心  · 公众号  · AI  · 2024-12-27 11:47
    

文章预览

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com 论文一作为北卡罗来纳大学教堂山分校张子健,指导老师为北卡罗来纳大学教堂山分校助理教授 Huaxiu Yao。共同第一作者为华盛顿大学 Kaiyuan Zheng,其余作者包括来自北卡教堂山的 Mingyu Ding、来自华盛顿大学的 Joel Jang、Yi Li 和Dieter Fox,以及来自芝加哥大学的 Zhaorun Chen、Chaoqi Wang。   论文标题:GRAPE: Generalizing Robot Policy via Preference Alignment 论文链接:https://arxiv.org/abs/2411.19309 项目地址:https://grape-vla.github.io 代码地址:https://github.com/aiming-lab/GRAPE 研究背景 近年来,视觉-语言 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览