注册
登录
专栏名称:
新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
宝玉xp
·
//@张欣丨Kenn:在使用agent模式的 ...
·
20 小时前
爱可可-爱生活
·
“AI不会取代程序员,但会让程序员更容易取代 ...
·
昨天
爱可可-爱生活
·
AI ...
·
2 天前
宝玉xp
·
一个 Claude ...
·
2 天前
黄建同学
·
ChatGPT首先改变的是人们获取知识的速度 ...
·
3 天前
今天看啥
›
专栏
›
新智元
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
新智元
·
公众号
·
AI
· 2024-12-11 11:30
文章预览
新智元报道 编辑:LRST 【新智元导读】 多模态大模型在听觉上,居然也出现了「9.11>9.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度。 在人工智能领域,我们一直以为顶尖的多模态大模型已经无所不能,GPT-4o在ASR(音频转文字)任务上已经达到了97%的正确率,更是凸显了强大的音频理解能力。 然而,最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成果却彻底颠覆了这一认知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先进的多模态大模型居然无法正确分辨明显不同的声音大小! 下面是一个例子: 结果让人难以置信:这些顶尖的AI模型都未能准确判断出音量的差异!对于人类来说,这种 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
宝玉xp
·
//@张欣丨Kenn:在使用agent模式的时候我的两个重要经验-20250104122343
20 小时前
爱可可-爱生活
·
“AI不会取代程序员,但会让程序员更容易取代其他人”这个论断直指-20250104085222
昨天
爱可可-爱生活
·
AI Agent正在悄然掀起一场企业数字化转型的新浪潮。让我们一-20250103061227
2 天前
宝玉xp
·
一个 Claude 提示词,可以吧一篇文章、图片、PDF 总结为-20250103012029
2 天前
黄建同学
·
ChatGPT首先改变的是人们获取知识的速度//@程序员邹欣:第-20250101101840
3 天前
医学新视点
·
总生存期近17个月!BMJ:这类胃癌患者治疗获益更大,死亡风险更低
7 月前
发财老博士
·
注意!又一堆雷!!
6 月前
AINLP
·
OpenAI-o3 与 Monte-Carlo 思想
3 天前