专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

图像生成别止步于扩散模型,自回归模型也很好用!LlamaGen:实现414%推理加速!

极市平台  · 公众号  ·  · 2024-06-26 22:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨科技猛兽 编辑丨极市平台 极市导读   应用与语言模型完全相同的 "next-token prediction" 的原始自回归模型也能够实现最先进的图像生成性能。   >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本文目录 1 LlamaGen:自回归模型击败扩散 (来自香港大学,字节跳动) 1 LlamaGen 论文解读 1.1 LlamaGen 的诞生背景 1.2 LlamaGen 总览 1.3 图像分词器 1.4 自回归模型生成图像 1.5 模型缩放 1.6 推理速度优化 1.7 图像分词器实验结果 1.8 图像生成实验结果 1.9 文生图实验结果 1.10 推理速度 太长不看版 LlamaGen 是一系列将大语言模型中 "next token prediction" 范式应用于生成领域的图像生成模型。LlamaGen 坚定地回答了这个问题,即:原始的自回归模型,比如 Llama[1][2](它没有 2D 视觉信号的归纳偏置),在缩放适当的前提下究竟能不能达到 SOTA 的图像 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览