专栏名称: AIWalker
关注计算机视觉、图像处理、深度学习等领域的干货分享与前沿paper解读。AIWalker由具有多年算法研究与产品化落地经验的Happy运营,原创为主、同时会转载优秀解读文章。欢迎志同道合的小伙伴们加入一同学习进步。
今天看啥  ›  专栏  ›  AIWalker

文生图击败所有扩散SOTA方案!智源研究院等提出NOVA:迈向统一的多任务大模型

AIWalker  · 公众号  ·  · 2024-12-24 22:01
    

文章预览

关注 「 AIWalker 」 并 星标 从此AI不迷路 作者: Haoge Deng 等     解读: AI生成未来  文章链接:https://arxiv.org/pdf/2412.14169 Github链接:https://github.com/baaivision/NOVA 亮点直击 : 高效的自回归建模 :NOVA提出了不使用向量量化的自回归视频生成方法,通过时间步预测和空间集预测的分离,结合双向建模,在提高生成效率的同时保持较高的视觉保真度和流畅性。 显著降低训练成本 :NOVA在文本到图像生成任务中超越了最先进的图像扩散模型,不仅在生成质量上表现出色,而且在训练成本上大幅降低,使得视频生成任务更具实用性。 良好的zero-shot泛化能力 :NOVA能够处理不同的视频时长和应用场景,具有强大的zero-shot能力,使其成为一个统一的多功能模型,适应多种生成任务。 文生图效果一览 总结速览 解决的问题: 现有的自回归视频生成模型(如图像或 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览