今天看啥  ›  专栏  ›  机器之心

视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化

机器之心  · 公众号  · AI  · 2024-10-20 12:32

文章预览

机器之心报道 编辑:Panda 现在正是「文本生视频」赛道百花齐放的时代,而且其应用场景非常多,比如生成创意视频内容、创建游戏场景、制作动画和电影。 甚至有研究表明还能将视频生成用作真实世界的模拟器,比如 OpenAI 今年初就发布过一份将视频生成模型作为世界模拟器的技术报告,参阅机器之心报道《 我在模拟世界!OpenAI 刚刚公布 Sora 技术细节:是数据驱动物理引擎 》。 文本生视频模型的这些近期应用既有望实现互联网规模级别的知识迁移(比如从生成人类视频到生成机器人视频),也有望打通实现通用智能体的道路(比如用单个策略控制不同环境中不同形态的机器人来执行多种多样的任务)。 然而,现实情况是,文本生视频模型的下游应用还很有限,原因包括幻觉问题以及生成的视频内容不符合现实物理机制等。 虽然理论上可以通 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览