文章预览
近期,快手开源了一种名为Kolors(可图)的文本到图像生成模型,该模型具有对英语和汉语的深刻理解,并能够生成高质量、逼真的图像。 魔搭社区在DiffSynth-Studio中提供了可图Kolors微调脚本。 代码开源链接: https://github.com/Kwai-Kolors/Kolors 模型开源链接: https://modelscope.cn/models/Kwai-Kolors/Kolors 技术报告链接: https://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf 微调脚本链接: https://github.com/modelscope/DiffSynth-Studio/tree/main/examples/train/kolors 01 微调最佳实践 下载模型权重 下载可图Kolors模型 modelscope download --model=Kwai-Kolors/Kolors --local_dir models/kolors/Kolors 下载额外的VAE模型( https://modelscope.cn/models/AI-ModelScope/sdxl-vae-fp16-fix ) modelscope download --model=AI-ModelScope/sdxl-vae-fp16-fix --local_dir models/kolors/sdxl-vae-fp16-fix diffusion_pytorch_model.safetensors 模型文件结构: models
………………………………