专栏名称: AIGC Research
AIGC Research|AI for Creativity Plan (AI4C Plan)|from ShanghaiTech University|致力于探索AIGC赋能创意智能|保持卓越学术品位和极致艺术追求
目录
相关文章推荐
小众软件  ·  另外两件事[241122] ·  2 天前  
APPSO  ·  iPhone 17 Air ... ·  4 天前  
APPSO  ·  华为 Mate 70 ... ·  6 天前  
今天看啥  ›  专栏  ›  AIGC Research

181-B1|结合扩散解码器的多模态VAE,在扩散模型中实现局部编辑,图像描述生成系列|Mon

AIGC Research  · 公众号  ·  · 2024-09-02 16:00

文章预览

AIGC   Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Image Generation|Diffusion & Multimodal VAEs Revising Multimodal VAEs with Diffusion Decoders 2024-08-29|UIC |⭐️ http://arxiv.org/abs/2408.16883v1 概述 本研究提出了一种新的 多模态变分自编码器(MDDVAE) ,旨在通过 结合扩散解码器 来提高生成任务的质量。 传统的多模态变分自编码器(VAE)在处理复杂模态(如图像)时往往存在质量下降的问题 ,这主要是由于其限制性的联合表示形式所致。现有的研究虽然采取了模态特定的表示方法有所改善,但依然未能彻底解决问题。 我们的方法通过引入灵活的扩散解码器,专门用于图像模态, 这不仅提高了图像生成质量,还对依赖前馈解码器的其他模态的性能产生了积极影响。通过融合扩散解码器,我们的模型在多个数据集上显示出较其他多模态VAE更高 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览