专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX

新智元  · 公众号  · AI  · 2024-10-17 12:41

文章预览

   新智元报道   编辑:桃子 好困 【新智元导读】 一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。 一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。 如此神速AI生图工具,竟是出自英伟达MIT清华全华人团队之笔! 正如其名字一样,Sana能以惊人速度合成高分辨率、高质量,且具有强文本-图像对其能力的模型。 而且,它还能高效生成高达4096×4096像素的图像。 项目主页:https://nvlabs.github.io/Sana/ 论文地址:https://arxiv.org/abs/2410.10629 Sana的核心设计包含了以下几个要素: 深度压缩自编码器(AE): 传统自编码器只能将图像压缩8倍,全新AE可将图像压缩32倍,有效减少了潜在token的数量。 线性DiT (Diffusion Transformer): 用「线性注意力」 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览