文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Image Generation|Evaluation|Knowledge-Intensive & Visual Entities KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities KITTEN 2024-10-15|Google DeepMind, UC Merced |⭐️ 🟡 http://arxiv.org/abs/2410.11824v1 https://kitten-project.github.io/ 概述 在近年来,文本到图像生成技术的迅猛发展使得生成的图像质量显著提升。然而, 现有的评估方法主要集中在审美效果或与文本提示的一致性上,缺乏对生成图像是否能够准确再现各种现实视觉实体的深入理解 。为了解决这一问题,研究者们提出了KITTEN( 知识密集型图像生成评估基准),旨在系统性地评估文本到图像生成模型在生成真实世界实体方面的准确性 。KITTEN通过引入来自维基百科的实体知识,涵盖多个视觉领域(如地标建筑、飞行器、植物和
………………………………