文章预览
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 没想到…… Stable Diffusion 3 开源即出现翻车案例。 生成一个躺在草地上的女孩,结果长这样? 而且不是个例,只要是和人 (整体) 相关的内容,生成结果都有点掉san。 ( 前方高能 ) 但如果是局部,比如只生成人脸,确实很nice。 清晰度、写字、写实性等方面都有明显提升。 对于复杂长提示词的理解也很到位,有网友发现提示越长它画的越好。 那么问题来了,为啥偏偏画不好人类? 问题可能在于数据集 先来看看SD3开源的具体情况。 本次开源的版本是 Stable Diffusion 3 Medium (中杯)。 它的规模为 20亿 参数,在笔记本上就能跑了。 官方强调的属性有5方面,逐一来看: 整体质量和写实 性 可生成出色的细节,包括色彩、光线、强写实等,带来灵活风格的高质量输出。 通过16通道VAE,成功解决了其他模型的常
………………………………