2024-08-20 05:36
本条微博链接
通过直接对 JPEG 图像编码进行建模,使用 Vanilla Transformer实现了高质量的图像生成,为多模态 LLC 的统一建模范式提供了有益探索。
[CL]《JPEG-LM: LLMs as Image Generators with Canonical Codec Representations》X Han, M Ghazvininejad, P W Koh, Y Tsvetkov [University of Washington FAIR at Meta] (2024) 网页链接 #机器学
………………………………