MAR(Masked AutoRegressive): 破除封建迷信——谁说自回归图像生成一定需要 VQ的！

arXiv每日学术速递 · 公众号 · · 2024-08-11 13:26

文章预览

作者丨CW不要無聊的風格编辑丨极市平台极市导读文章讨论了MAR模型和VQ技术在自然语言处理中的应用。文章首先介绍了autoregressive模型的基本原理，然后指出了LLMs在处理这类模型时可能遇到的挑战。接着，文章重点介绍了VQ技术，这是一种将连续值向量映射到离散表示的方法，有助于提高模型的效率和性能。前言提到自回归(autoregressive)，相信有人会立马举手说：这个我熟！就是 _从左到右按顺序一个个地进行预测_，现在如火如荼的 LLMs 就是这么玩的。没毛病~ 这种认知似乎已经成为一种刻板印象烙在我们脑子里了。进一步，如果将自回归生成用于图像，那么就需要对连续(continuous-valued)的像素进行离散化，变为离散的 token，从而才能在预测时实现对 token 的分类预测，这种离散化的技术被称作 "VQ(Vector Quantization)". 嗯，这又是一个刻板印象 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

小众软件 · 离中谱，微软真的淘汰了远程桌面。新 Windows App 唯独不支持 Windows 普通用户

昨天

小众软件 · 竹白将于本月底正式下线

2 天前

APPSO · AI 时代的超级应用，是一个超级框

2 天前

APPSO · 英特尔官宣史上首位华人 CEO，芯片三巨头由华人掌舵

2 天前

中外合办升学指导 · 西浦创业家学院，创业与创新硕士首届毕业生分享：创新精神与实践成就的融合！

7 月前

开放数据空间联盟 · 万物皆可数据空间｜动态台账+智能闸门+公平标尺：数据资产全流程变革新范式

1 月前