专栏名称: IPO早知道
图哇图哇网络
今天看啥  ›  专栏  ›  IPO早知道

智谱发布首个支持生成汉字的开源文生图模型CogView4,性能达到SOTA

IPO早知道  · 公众号  · 科技创业  · 2025-03-04 23:02
    

主要观点总结

智谱于3月4日发布「智谱2025开源年」的第一个模型——CogView4,这是首个支持生成汉字的开源文生图模型。该模型在DPG-Bench基准测试中综合评分排名第一,具备复杂语义对齐、指令跟随能力,支持任意长度的中英双语输入,并能生成任意分辨率的图像。此外,CogView4遵循Apache 2.0协议,具有技术领先性,如支持中英双语提示词输入、具备双语提示词输入能力等。智谱是国内最早的开源大模型公司,致力于推动AI普惠,并计划陆续开源更多模型。

关键观点总结

关键观点1: 智谱发布首个支持生成汉字的开源文生图模型CogView4

CogView4是首个遵循Apache 2.0协议的图像生成模型,具备较强的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,能够生成任意分辨率的图像。

关键观点2: CogView4在DPG-Bench基准测试中排名第一

DPG-Bench是一个用于评估文本到图像生成模型的基准测试,CogView4在其中表现出卓越的性能,验证了其复杂语义对齐和指令跟随能力。

关键观点3: CogView4的技术领先性

CogView4支持中英双语提示词输入,具备双语提示词输入能力,并实现了任意长度的文本描述和任意分辨率图像的混合训练范式,提高了训练效率和用户创作的自由度。

关键观点4: 智谱公司致力于推动AI普惠

智谱作为国内最早的开源大模型公司,计划陆续开源更多模型,如基础模型、推理模型、多模态模型、Agent模型等。


文章预览

「智谱2025开源年」的第一个模型。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao    据IPO早知道消息,智谱于3月4日发布了「智谱2025开源年」的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在 DPG-Bench基准测试中的综合评分排名第一,在开源文生图模型中达到SOTA。该模型也是首个遵循 Apache 2.0协议的图像生成模型。 具体来讲: CogView4具备较强的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,能够生成在给定范围内的任意分辨率图像,同时具备较强的文字生成能力。 值得一提的是, CogView4在 DPG-Bench基准测试中的综合评分排名第一,在开源文生图模型中达到SOTA。 DPG-Bench(Dense Prompt Graph Benchmark)是一个用于评估文本到图像生成模型的基准测试,主要关注模型在复杂语义对齐和指令跟随能力方面的表现。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览