MM 2024 Oral: 大模型带你鉴赏世界名画！同济大学发布

夕小瑶科技说 · 公众号 · · 2024-08-30 14:32

文章预览

夕小瑶科技说原创作者 | 谢年年现有的大模型已经能够创作令人惊叹画作，那鉴赏艺术画作岂不是信手拈来？但同济大学的研究团队却发现——并非如此。他们发现这些大模型虽然对熟知的知名画作分析得头头是道，但一遇到较为冷门的画作就容易产生“视觉幻觉”，造成诸如张冠李戴的错误。比如给大模型看梵高的《向日葵》，它能从画面布局、色彩搭配到笔触技巧等各个方面给出详尽的分析，相当准确：然而，一换到那些不太出名的画作前，即便是像Gemini和GPT-4V这样强大的模型也会犯迷糊。（图中红色表示错误分析）作者认为现有的大模型在分析画作时，往往倾向于首先识别给定的画作，然后相应地进行分析。简单来说，他们是先认出了这副画，然后再从记忆中调取关于这幅画的知识。这仅限于照本宣科，还不是真正意义上的具备鉴 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博