专栏名称: 卡尔的AI沃茨
- 前阿里&百度大模型算法|AI创业者|擅长GPT开发及数字人应用- 创建开源AI学习体系learnprompt.pro,社群破万- 持续输出AI前沿科技资讯,关注我,让更多人成为AGI时代的创作者
今天看啥  ›  专栏  ›  卡尔的AI沃茨

智谱开源了文生图模型CogView4,我们的诗歌从此有了画面

卡尔的AI沃茨  · 公众号  ·  · 2025-03-04 18:53
    

文章预览

活久见, OpenAI十二天发布会,DeepSeek开源周, 刚融了杭州10个亿的智谱卷出了新高度,接下来是「开源年」。 好陌生的单词, 智谱有意思的点就是因为它覆盖了基座、推理、多模态模型,以及 Agent。每次它更新就想抽盲盒一样。 大概,开源的模型太多,也算是一件幸福的烦恼吧。 这次有幸内测上了开源年的第一个开源模型: CogView4-6B 一个支持中英双语提示语输入,能画古诗文,同时支持在画面中生成中英文字体的文生图开源模型, 在 DPG-Bench基准测试中的综合评分排名第一,在开源文生图模型中达到 SOTA,超过了DeepSeek的Janus-Pro-7B、Flux.1-dev、SD3-Medium。 更6的是, 支持在2048*2048任意范围的分辨率生成 ,再加上模型对同一个提示语的遵循度很高,这样的好处就是不会因为后期裁剪放大而影响清晰度,而且我可以随心生成各种尺寸的图片,不再局限 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览