绘梦有形，快手开源「可图 Kolors」，等你来玩

魔搭ModelScope社区 · 公众号 · · 2024-07-11 12:00

文章预览

01 引言近期，快手开源了名为Kolors（可图）的文本到图像生成模型，该模型具有对英语和汉语的深刻理解，并能够生成高质量、逼真的图像。技术报告中也提了几个重要的工作内容：首先，Kolors基于通用语言模型（ChatGLM），而不是像Imagen和Stable Diffusion 3基于大语言模型T5，这增强了其对英语和汉语的理解能力，并利用多模态大型语言模型CogVLM重新为训练数据集中的图像生成更详细的描述；其次，Kolors训练分为两个阶段，即概念学习阶段和质量改进阶段，并使用特定的数据集进行训练以提高视觉吸引力，通过引入高质量的数据和优化高分辨率训练技术来改善图像质量；最后，Kolors团队提出了一种平衡类别的基准数据集KolorsPrompts，用于指导Kolors的训练和评估。实验结果表明，即使使用U-Net backbone，可图Kolors也表现出色，在人类评价中超越了现有的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新闻广角 · 密密麻麻几百个！整整吸出来一盘！男子惊魂未定：再也不敢了…...

21 小时前

新闻广角 · 上海突发！大巴猛烈撞击，车头骑上护墙，龙门架被撞倾斜，驾驶员受伤

昨天

新闻广角 · 凌晨，歌手周深含泪鞠躬道歉

昨天

新闻广角 · 切尔诺贝利核电站传出爆炸声，目前辐射水平正常

2 天前

新闻广角 · 数百名游客因天气原因滞留南极，一行八人额外支出20多万

3 天前

创策汇SH · 【奉贤区】关于组织开展2024年度奉贤区科技小巨人项目申报的通知

8 月前

生信人 · 纯生信分析发NC技巧

7 月前

气象北京 · 错过了今儿18:56《北京新闻》后的天气预报？没关系，咱们补上!（2024-10-23）

3 月前