专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
目录
相关文章推荐
今天看啥  ›  专栏  ›  斌叔OKmath

LLM 作为具有规范编解码器表示的图像生成器讨论: 网页链接图像-20240820060030

斌叔OKmath  · 微博  ·  · 2024-08-20 06:00
    

文章预览

2024-08-20 06:00 本条微博链接 LLM 作为具有规范编解码器表示的图像生成器 讨论: 网页链接 图像和视频生成领域的最新研究一直采用自回归 LLM 架构,因为它具有通用性,并且可能易于集成到多模态系统中。将语言生成中的自回归训练应用于视觉生成的关键是离散化--即将图像和视频等连续数据表示为离散标记。离散化图像和视频的常用方法包括对原始像素值进行建模(这些值非常长)或矢量量化(这需要复杂的预处理训 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览