文章预览
近日,智源研究院发布最新的FlagEval 大模型评测排行榜。结果显示,在多模态模型评测榜单的文生图模型中, 腾讯混元的文生图能力位 居榜首 。随后分别为字节跳动的豆包模型,以及国外Ideogram研发的文本生成图像模型 Ideogram 2.0。 智源官网排行榜截图 FlagEval是由北京智源人工智能研究院(BAAI)推出的大模型评测体系及开放平台,用于评估基础模型及训练算法的性能,评测范围涉及国内外100余个开源和商业闭源模型,覆盖大语言模型,视觉语言、文生图、文生视频、语音语言等多模态模型等领域。 据介绍,该文生图评测采用主观评测作为排名依据,客观评测数据仅供参考。主观评测从图文一致性、图片质量、美学质量和安全性四个维度进行人工打分,在最终主观排名里,这四个维度的权重分别5:2:2:1,以此分数作为最终主观排名分数。每张
………………………………