专栏名称: AIWalker

关注计算机视觉、图像处理、深度学习等领域的干货分享与前沿paper解读。AIWalker由具有多年算法研究与产品化落地经验的Happy运营，原创为主、同时会转载优秀解读文章。欢迎志同道合的小伙伴们加入一同学习进步。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

恺明新作Fluid：文生图质量刷新纪录！

AIWalker · 公众号 · · 2024-10-24 22:00

文章预览

关注「 AIWalker 」并星标从此AI不迷路作者： Lijie Fan等解读： AI生成未来文章链接：https://arxiv.org/pdf/2410.13863 缩放法则（Scaling laws）是大语言模型（LLMs）前所未有成功的基础。实证研究表明，在自回归模型中增加参数数量通常会显著提升性能，并在自然语言处理（NLP）任务中产生新的能力。这一实证关系激励了众多扩展语言模型的努力，导致许多高性能模型的发展。受到这一成功的鼓舞，许多尝试将自回归模型应用并扩展到计算机视觉领域，特别是在文本到图像生成等生成任务中。然而，这些模型生成的内容在性能和视觉质量上往往不及其他生成模型，如扩散模型，使得在视觉领域是否适用类似的缩放法则仍不清楚。本文提出了几个关于性能差距的假设。首先，大多数视觉自回归模型所需的矢量量化（VQ）步骤可能会引入显著的信息 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博