今天看啥  ›  专栏  ›  腾讯云

腾讯混元文生图大模型全面开源!

腾讯云  · 公众号  ·  · 2024-05-14 16:47

文章预览

和大家汇报: 刚刚,腾讯混元文生图大模型,全面升级并对外开源! 作为业内首个中文原生的DiT架构开源模型,腾讯混元文生图支持中英文双语输入及理解。 除 直接用于文生图,也可作为视频等多模态视觉生成的基础。 介绍一下,我的几项标签: //DiT架构 优秀的大模型,离不开领先的技术架构。 去年7月,腾讯混元文生图团队就明确了基于DiT架构的模型方向。 (DiT是基于Transformer的扩散模型架构,是Sora、Stable Diffusion 3 也选用的关键技术。) 今年初,腾讯混元文生图完成了模型架构的全面升级, 相比上一代整体效果提升超过20%。 //中文原生 此前,Stable Diffusion等主流文生图开源模型,核心数据集以英文为主,基于Stable Diffusion的中文应用本质上是通过中译英的方式处理文本。 碰上古诗词、民间俚语、传统建筑等中国元素,又或者「红烧狮子头」 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览