文章预览
今日值得关注的大模型前沿论文: VD3D:首个基于 transformer 的视频扩散模型相机控制 应当扩大 语言模型不服从的范围 Goldfish:对任意长度视频的视觉-语言理解 微信 AI:大语言模型的补丁级训练 LMMs-Eval:对大型多模态模型评估的现实检验 AgentPoison:通过“毒化”记忆或知识库对 LLM 智能体进行红队攻击 想要获取更多大模型热门论文? 点击“阅读原文” ,获取 「2024 必读大模型论文」 合集,持续更新中~ 01 VD3D:首个基于 transformer 的 视频扩散模型相机控制 当前的文本到视频合成模型展示了从文本描述生成连贯、逼真的复杂视频的能力。然而,大多数现有模型缺乏对相机运动的细粒度控制,而这对于内容创作、视觉效果和 3D 视觉等下游应用至关重要。 最近,一些新方法展示了生成具有可控相机姿态的视频的能力——这些技术利用了预训练的基于
………………………………