注册登录

专栏名称: 大模型智能

机器学习算法、深度学习算法、自然语言处理等干货知识集中营

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

新加坡眼SgEye · 新加坡这个影院的票价，比中国国内还便宜 · 11 小时前

新加坡眼SgEye · 重回5.42！新币兑人民币汇率又涨回来了 · 11 小时前

新加坡眼SgEye · 新加坡建屋局保证：租户收入增多，租金不涨！ · 昨天

新加坡眼SgEye · 在新加坡学习华文，李光耀称要上强硬手段 · 2 天前

今天看啥 › 专栏 › 大模型智能

全华人团队推出多模态大模型新基准，GPT-4o准确率仅为65.5%，所有模型最易犯感知错误

大模型智能 · 公众号 · · 2024-06-15 00:05

文章预览

大模型智能｜分享来源 | 量子位作者 | 王家豪 GPT-4o再次掀起多模态大模型的浪潮。如果他们能以近似人类的熟练程度，在不同领域执行广泛的任务，这对许多领域带来革命性进展。因而，构建一个全面的评估基准测试就显得格外重要。然而评估大型视觉语言模型能力的进程显著落后于它们自身的发展。来自上海AI Lab、香港大学、上海交大、浙江大学等多家机构提出了 MMT-Bench。这是一个全方位的多模态基准测试，旨在全面评估大型视觉语言模型（LVLMs）在多模态多任务理解方面的表现。研究团队还对当前几个代表的视觉大模型进行了能力评估，结果发现感知错误、推理错误是所有模型最常见的两大错误。 01 多模态多任务AGI基准测试MMT-Bench MMT-Bench的广度体现在三个方面。首先，MMT-Bench数据经过精心设计，包含32K个多选视觉语言问题，涵盖了32 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新加坡眼SgEye · 新加坡这个影院的票价，比中国国内还便宜

11 小时前

新加坡眼SgEye · 重回5.42！新币兑人民币汇率又涨回来了

11 小时前

新加坡眼SgEye · 新加坡建屋局保证：租户收入增多，租金不涨！

昨天

新加坡眼SgEye · 在新加坡学习华文，李光耀称要上强硬手段

2 天前

弗雷赛斯 · 画科研机制图，我们599元封顶

5 月前

新浪科技 · 【美媒：#马斯克对巴西最高法院作重大让步# ，#巴西或将解禁X平-20240922110310

5 月前

Supreme情报网 · 科嫂快乐鞋！「科比Kobe x 耐克」近亲联名，3款实物大曝光！

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号