专栏名称: 智见AGI
神州问学公众号是围绕生成式AI技术的交流社区,与开发者和合作伙伴共同探究有深度的生成式AI技术前沿洞见、技术迭代、案例解析、方法和实践,助力企业的数字化转型
今天看啥  ›  专栏  ›  智见AGI

Stable Diffusion 3开源秒翻车,画人好掉san

智见AGI  · 公众号  ·  · 2024-06-19 17:55
    

文章预览

来源 | 量子位 没想到…… Stable Diffusion 3 开源即出现翻车案例。 生成一个躺在草地上的女孩,结果长这样? 而且不是个例,只要是和人(整体)相关的内容,生成结果都有点掉san。 ( 前方高能 ) 但如果是局部,比如只生成人脸,确实很nice。 清晰度、写字、写实性等方面都有明显提升。 对于复杂长提示词的理解也很到位,有网友发现提示越长它画的越好。 那么问题来了,为啥偏偏画不好人类? 问题可能在于数据集 先来看看SD3开源的具体情况。 本次开源的版本是 Stable Diffusion 3 Medium (中杯)。 它的规模为 20亿 参数,在笔记本上就能跑了。 官方强调的属性有5方面,逐一来看: ●整体质量和写实性 可生成出色的细节,包括色彩、光线、强写实等,带来灵活风格的高质量输出。 通过16通道VAE,成功解决了其他模型的常见缺陷,比如手部和面部的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览