专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

ICML 2024 | DecisionNCE:多模态表征预训练加速具身智能

将门创投  · 公众号  · 科技创业  · 2024-06-21 08:44
具身智能作为通用人工智能(AGI)研究的重要目标,旨在让机器人能够执行人类通过自然语言描述的各类任务。视觉-语言-控制模型(VLCM)是实现这一目标的关键技术,它融合了视觉理解、语言理解和动作控制三个模态。然而,VLCM模型的训练面临着数据稀缺的挑战。本文提出DecisionNCE,为利用无动作标签的分布外数据(action-free, out-of-domain)提高具身智能的问题提供了一种高效、优美、简洁的表征预训练方案,通过将机器人决策有用的信息提取到表征中,来加速下游具身智能的学习,降低其对训练数据的依赖。论文标题:DecisionNCE:Embodied Multimodal Representations via Implicit Preference Learning论文链接:https://arxiv.org/abs/2402.18137代码链接:https://github.com/2toinf/DecisionNCE?tab=readme-ov-file项目主页:https://2toinf.github.io/DecisionNCE/一、端到端训练数据的稀缺问题具身智 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照