今天看啥  ›  专栏  ›  人工智能前沿讲习

图像生成别止步于扩散模型,自回归模型也很好用!LlamaGen:实现414%推理加速!

人工智能前沿讲习  · 公众号  ·  · 2024-06-28 18:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨科技猛兽 编辑丨极市平台 极市导读   应用与语言模型完全相同的 "next-token prediction" 的原始自回归模型也能够实现最先进的图像生成性能。   >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本文目录 1 LlamaGen:自回归模型击败扩散 (来自香港大学,字节跳动) 1 LlamaGen 论文解读 1.1 LlamaGen 的诞生背景 1.2 LlamaGen 总览 1.3 图像分词器 1.4 自回归模型生成图像 1.5 模型缩放 1.6 推理速度优化 1.7 图像分词器实验结果 1.8 图像生成实验结果 1.9 文生图实验结果 1.10 推理速度 太长不看版 LlamaGen 是一系列将大语言模型中 "next token prediction" 范式应用于生成领域的图像生成模型。LlamaGen 坚定地回答了这个问题,即:原始的自回归模型,比如 Llama[1][2](它没有 2D 视觉信号的归纳偏置),在缩放适当的前提下究竟能不能达到 SOTA 的图像 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览