专栏名称: AIGC Research

AIGC Research｜AI for Creativity Plan (AI4C Plan)｜from ShanghaiTech University｜致力于探索AIGC赋能创意智能｜保持卓越学术品位和极致艺术追求

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

219-B1｜开放世界互动决策，几何推理；多图像增强直接偏好优化，通过自定义提示降低评估偏差，以实体为中心的图文匹配｜Thu

AIGC Research · 公众号 · · 2024-10-24 23:30

文章预览

AIGC Research < PaperDaily> 主编｜庄才林（Cailin Zhuang）技术支持｜胡耀淇（Yaoqi Hu）发布日期｜2024年 10月 24 日｜周四 Topic: Multi-modal｜Open-World Interaction, Geometric Reasoning ROCKET-1: Master Open-World Interaction with Visual-Temporal Context Prompting ROCKET-1 2024-10-23｜PKU, UCLA, BIGAI, CraftJarvis ｜⭐️ 🟡 http://arxiv.org/abs/2410.17856v1 https://craftjarvis.github.io/ROCKET-1 概述 ROCKET-1是一种新型的层次化智能体架构，旨在解决开放世界环境中的互动决策问题，特别是在Minecraft等复杂任务中。传统的视觉语言模型（VLMs）在多模态任务中表现优异，但在处理低级观察与抽象概念之间的连接时存在挑战。为了克服这些限制，ROCKET-1引入了视觉-时间上下文提示（visual-temporal context prompting），这一创新的通信协议通过利用过去和现在的观察中的对象分割信息，来引导策略与环境的互动。这种 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

吉市找铺 · 仓山南湖片区南片区启动征迁！将打造福州首个不夜城！

23 小时前

吉市找铺 · 仓山南湖片区南片区启动征迁！将打造福州首个不夜城！

23 小时前

运维 · 拒绝背锅！39 岁失业后，我写出了一个超一万亿使用量的数据库

2 天前

运维 · 今年运维这工资是认真的吗？

2 天前

趁早行动 · 好好活过，不辜负这一场。

9 月前

北大青年CEO俱乐部 · 校友企业 | 蓝晶微生物上海总部盛大开幕，向光·可持续商业会客厅首站惊艳亮相！

9 月前