专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

MSRA：视觉生成六大技术问题

量子位 · 公众号 · AI · 2024-07-13 10:56

主要观点总结

文章讨论了视觉生成赛道中的视觉信号拆分问题，指出大语言模型成功的原因在于文本信号拆分的等变性。对于图像信号拆分，目前存在多种方法但都不具备等变性，导致一系列问题。文章还讨论了扩散模型是否是最太似然模型、扩散模型的scaling law等问题。

关键观点总结

关键观点1: 视觉信号拆分问题

文章指出视觉生成模型的目标时拟合目标数据分布，由于目标数据分布过于复杂，往往需要将复杂的信号做拆分。目前针对图像信号的拆分方式包括图像块拆分、深度拆分、噪声强度拆分以及可学习拆分等，但这些方式都不具备等变性。

关键观点2: 大语言模型的等变性

文章解释了为什么大语言模型能够成功，其本质原因在于文本信号拆分具有等变性。对于一个文本序列，语言模型会根据位置把联合数据分布拆分成多个条件概率分布拟合问题。

关键观点3: 扩散模型与最大似然模型的关系

文章讨论了扩散模型是否是最太似然模型的问题。虽然DDPM从最大似然的角度出发推导了扩散模型的理论，但扩散模型并非严格意义上的最大似然模型。

关键观点4: 扩散模型的scaling law

文章讨论了扩散模型的scaling law问题。目前对于扩散模型的scaling law的衡量指标存在争议，可以采用不同任务的难度系数当重要性系数、利用已有的生成模型衡量指标如FID、直接采用人工标注衡量模型质量等方式来衡量。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

人工智能产业链union · 【报告】机器人专题一：深度解读《2026年全球前15名人形机器人》：人形机器人量产元年，谁在领跑？（附PDF下载）

14 小时前

爱可可-爱生活 · SIA 是一套自主迭代的 AI 框架，它让任意模型或 Agent-20260612153234

19 小时前

AI寒武纪 · 全程0次打开剪辑软件！揭秘Claude Fable 5如何纯靠写代码剪完自己的4K宣传片

昨天

量子位 · SpaceX一上市，连食堂阿姨都要成百万富翁了。。。

昨天

新智元 · AI智能体走出实验室！中科院等机构联合发布首个OpenClaw系统性综述

昨天

质量与认证 · 关注 | 不如实开展检验，主管部门不得采信报告

1 年前

RNAScript · 复诺健生物开发新型自复制mRNA，引入NSPs宏结构域突变，降低细胞毒性增强蛋白质表达

1 年前

福布斯 · 成交价逾2.6亿港元，香港赤柱临海超级豪宅“ONE STANLEY”创年内记录

1 年前

东莞本地宝 · 4月30日-5月5日，东莞2个高速入口临时交通管制！

1 年前

黑龙江省应急管理厅 · 假期乐悠悠平安伴左右 | 这份游乐场所安全“秘籍”请装进你的行囊

1 年前