专栏名称: AIGCResearch
AIGC Research|AI for Creativity Plan (AI4C Plan)|from ShanghaiTech University|致力于探索AIGC赋能创意智能|保持卓越学术品位和极致艺术追求
今天看啥  ›  专栏  ›  AIGCResearch

185-B1|大型VLM掌握了艺术史吗?基于MoE架构的图表理解,MLLM从图像到视频理解;音频驱动说话头系列(生动性、局部细微

AIGCResearch  · 公众号  ·  · 2024-09-07 06:00

文章预览

AIGC   Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Multi-modal|VLMs Art History, MLLMs Chart Understanding Have Large Vision-Language Models Mastered Art History? 2024-09-05|KU Leuven, TU Delft | ⭐️ http://arxiv.org/abs/2409.03521v1 https://github.com/ombretta/VLMs-vs-ArtHistory 概述 本研究旨在探讨大型视觉-语言模型(Vision-Language Models, VLMs)对艺术历史,尤其是艺术风格分类的掌握程度 。现有的VLMs在图像分类方面已经达到了一定的基准,但它们在艺术作品, 尤其是绘画的艺术风格、作者和时期的分类任务中的表现还未得到充分研究。 由于艺术作品的独特复杂性,艺术历史的分类任务通常要求对作品的多种特征进行深入理解。研究考虑了四种不同的VLMs,即CLIP, LLaVA, OpenFlamingo和GPT-4o,分析它们在没有专门训练的情况下在艺术风格、作者和时间段预测中的零-shot性能, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览