专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

如何分解视觉信号？一文浅谈视觉生成领域存在的若干问题

PaperWeekly · 公众号 · 科研 · 2024-08-04 21:36

文章预览

©PaperWeekly 原创 · 作者 | 古纾旸单位 | 微软亚洲研究院研究员研究方向 | 视觉生成当今视觉生成问题非常火热，文生图，文生视频等方向取得了很好的进展。然而视觉生成中仍然有非常重要的一些问题亟需解决，本文将对这些问题进行梳理。生成模型的目标是拟合目标数据分布，然而，目标数据分布往往过于复杂，难以直接拟合。因此，往往需要将复杂的信号做拆分，拆分成多个简单的分布拟合问题，再分别求解。根据信号拆分方式的不同，产生了不同的生成模型。视觉信号拆分问题为什么大语言模型这么成功呢？作者认为，最本质的原因是文本信号拆分具有“等变性”。具体来说，对于一个文本序列会根据位置把的联合数据分布拆分成多个条件概率分布拟合问题：对于一个文本，比如说“我喜欢打篮球”，用自回归的方式进行拟 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博