专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

GPT-4o再暴露「弱智」缺陷，大模型无一幸免！港中文等发布「视觉听觉」基准AV-Odyssey：26个任务直指死角问题

新智元 · 公众号 · AI · 2024-12-11 11:30

文章预览

新智元报道编辑：LRST 【新智元导读】多模态大模型在听觉上，居然也出现了「9.11>9.8」的现象，音量大小这种简单问题都识别不了！港中文、斯坦福等大学联合发布的AV-Odyssey基准测试，包含26个视听任务，覆盖了7种声音属性，跨越了10个不同领域，确保测试的深度和广度。在人工智能领域，我们一直以为顶尖的多模态大模型已经无所不能，GPT-4o在ASR（音频转文字）任务上已经达到了97%的正确率，更是凸显了强大的音频理解能力。然而，最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成果却彻底颠覆了这一认知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先进的多模态大模型居然无法正确分辨明显不同的声音大小！下面是一个例子：结果让人难以置信：这些顶尖的AI模型都未能准确判断出音量的差异！对于人类来说，这种 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · //@张欣丨Kenn:在使用agent模式的时候我的两个重要经验-20250104122343

20 小时前

爱可可-爱生活 · “AI不会取代程序员，但会让程序员更容易取代其他人”这个论断直指-20250104085222

昨天

爱可可-爱生活 · AI Agent正在悄然掀起一场企业数字化转型的新浪潮。让我们一-20250103061227

2 天前

宝玉xp · 一个 Claude 提示词，可以吧一篇文章、图片、PDF 总结为-20250103012029

2 天前

黄建同学 · ChatGPT首先改变的是人们获取知识的速度//@程序员邹欣:第-20250101101840

3 天前

医学新视点 · 总生存期近17个月！BMJ：这类胃癌患者治疗获益更大，死亡风险更低

7 月前

发财老博士 · 注意！又一堆雷！！

6 月前

AINLP · OpenAI-o3 与 Monte-Carlo 思想

3 天前