视频生成模型变身智能体：斯坦福Percy Liang等提出VideoAgent，竟能自我优化

机器之心 · 公众号 · AI · 2024-10-20 12:32

文章预览

机器之心报道编辑：Panda 现在正是「文本生视频」赛道百花齐放的时代，而且其应用场景非常多，比如生成创意视频内容、创建游戏场景、制作动画和电影。甚至有研究表明还能将视频生成用作真实世界的模拟器，比如 OpenAI 今年初就发布过一份将视频生成模型作为世界模拟器的技术报告，参阅机器之心报道《我在模拟世界！OpenAI 刚刚公布 Sora 技术细节：是数据驱动物理引擎》。文本生视频模型的这些近期应用既有望实现互联网规模级别的知识迁移（比如从生成人类视频到生成机器人视频），也有望打通实现通用智能体的道路（比如用单个策略控制不同环境中不同形态的机器人来执行多种多样的任务）。然而，现实情况是，文本生视频模型的下游应用还很有限，原因包括幻觉问题以及生成的视频内容不符合现实物理机制等。虽然理论上可以通 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【bRAG-langchain：构建自己的RAG应用，探索从基础-20241119140825

4 天前

DataFunTalk · AI搜索在快消领域的最佳实践

4 天前

DataFunTalk · AI搜索在快消领域的最佳实践

4 天前

机器之心 · 怎样保证你不是AGI独裁者？马斯克为何退出OpenAI？早期邮件公开了

6 天前

字节跳动技术团队 · 「会说话」的 AI ，扣子智能语音 OpenAPI 开启内测申请

6 天前

字节跳动技术团队 · 「会说话」的 AI ，扣子智能语音 OpenAPI 开启内测申请

6 天前

爱可可-爱生活 · 晚安～ #晚安# -20241116231531

6 天前

院长聊房 · 重庆新房成交大涨超六成！抄底的窗口正在关闭！

5 月前

川大就业 · 校园招聘 | 成方金融科技有限公司2025届校园招聘

1 周前