专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

MM 2024 Oral: 大模型带你鉴赏世界名画!同济大学发布

夕小瑶科技说  · 公众号  ·  · 2024-08-30 14:32

文章预览

夕小瑶科技说 原创 作者 | 谢年年 现有的大模型已经能够创作令人惊叹画作,那鉴赏艺术画作岂不是信手拈来? 但同济大学的研究团队却发现——并非如此。 他们发现这些大模型虽然对 熟知的知名画作 分析得头头是道,但一遇到 较为冷门的画作 就容易产生“视觉幻觉”,造成诸如张冠李戴的错误。 比如给大模型看梵高的《向日葵》,它能从画面布局、色彩搭配到笔触技巧等各个方面给出详尽的分析,相当准确: 然而,一换到那些不太出名的画作前,即便是像Gemini和GPT-4V这样强大的模型也会犯迷糊。(图中红色表示错误分析) 作者认为现有的大模型在分析画作时,往往倾向于首先识别给定的画作,然后相应地进行分析。简单来说,他们是 先认出了这副画,然后再从记忆中调取关于这幅画的知识。这仅限于照本宣科,还不是真正意义上的具备鉴 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览