视频上下文学习！大模型学会“照猫画虎”生成，结合模拟器还能精准控制真实环境交互，来自MSRA

量子位 · 公众号 · AI · 2024-07-17 16:00

文章预览

Vid-ICL团队投稿量子位 | 公众号 QbitAI 视频生成也能参考“上下文”？！ MSRA提出视频上下文学习（Video In-Context Learning, Vid-ICL），让大模型学会“照猫画虎”式模仿生成。 Vid-ICL通过一段示例视频来指导模型在新场景下的生成，使得生成结果可以在新场景下“模仿”示例视频中完成的任务。比如，示例视频镜头视角向下移动（左），生成视频同样视角向下移动（右）：示例视频物体向上移动（左），生成视频同样向上移动（右）：物体抓取也能模仿： △ 左：示例视频，机械臂抓取物体；右：生成视频打开抽屉也可以按示例进行： △ 左：示例视频，打开中间的抽屉；右：生成视频在相同的电风扇场景下，用不同示例视频指导模型生成效果belike： △ 左：示例视频，镜头左移；右：生成视频 △ 左：示例视频，镜头右移；右：生成视频 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【Attention Neural Networks Lectu-20250325191825

2 天前

爱可可-爱生活 · 从头开始学习人工智能的十大 YouTube 频道：1) Andr-20250325193223

2 天前

睡前消息编辑部 · DeepSeek隐藏功能大公开！90%的人都不知道！

2 天前

睡前消息编辑部 · DeepSeek隐藏功能大公开！90%的人都不知道！

2 天前

新智元 · 牛津教授惊人预警：AI十年科学发现，顶人类100年！科研速度已超人类500倍

2 天前

人工智能那点事 · ‌‌一场大病击垮一个家庭？这笔“隐形救命钱”你必须知道！

3 天前

今日新材料 · 研究进展：超冷-量子气 | Nature Reviews Physics

4 月前

Daxue Insights · Men’s rising influence in the lipstick market in China

1 月前