今天看啥  ›  专栏  ›  LLM SPACE

大模型日报(6月17日 学术篇)

LLM SPACE  · 公众号  ·  · 2024-06-17 19:09
    

文章预览

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢 迎 大 家 一 起 交 流 ! 论文 0 1 Pandora:朝向具有自然语言动作和视频状态的通用世界模型 世界模型模拟对不同行动的未来世界状态。它有助于互动内容创作,并为基于事实的、长期规划提供了基础。当前的基础模型未能完全满足通用世界模型的能力:大型语言模型(LLM)受限于其对语言形态的依赖和对物理世界的有限理解,而视频模型缺乏对世界模拟的互动行动控制。本文通过引入Pandora迈出了构建通用世界模型的一步,它是一种混合自回归扩散模型,通过生成视频模拟世界状态,并允许通过自由文本行动进行实时控制。Pandora通过大规模预训练和指导调整实现了领域通用性、视 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览