专栏名称: 脑机接口社区

国内领先的脑机接口自媒体和服务平台，旨在促进脑机接口研究和应用之间的合作及成果转化，为脑机接口领域的工作者提供一个专业的资讯发布、学术交流、成果展示及脑机科普平台。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

相关文章推荐

东莞本地宝 · 11:00！2025东莞超级草莓音乐节即将开 ... · 昨天

东南网莆田站 · 张韶涵、苏有朋、杨宗纬、萧敬腾喊你来莆田！ · 昨天

岳阳晚报社 · 多图直击！今夜，岳阳这里嗨爆了！ · 2 天前

福建省文化和旅游厅 · 今日开播！央视《乐在旅途》第三季福建泉州站踏 ... · 2 天前

江南都市报 · 知名歌手王蓉被淘汰引热议，本人回应：盼了“浪 ... · 3 天前

今天看啥 › 专栏 › 脑机接口社区

密歇根大学团队打造多模态大模型，能用于可穿戴设备和具身AI智能体

脑机接口社区 · 公众号 · · 2024-06-05 09:00

文章预览

近期，大语言模型（Large Language Models，LLMs）已经在理解和生成自然语言上取得了空前的成功。但是，人类依靠自己的大脑不仅仅可以读写文字，还可以看图、看视频、听音乐等。所以，为了让 AI 更接近真实世界，将额外的模态比如图像输入，融入大语言模型从而打造多模态大模型（MLLMs，Multi-modal LLMs），被认为是 AI 发展的一个关键新领域。相比纯文本数据，多模态数据更加难以获取，而从零开始直接训练多模态模型也比较困难。因此，目前的主流方法是基于预训练好的大语言模型，为其配备一个视觉感知模块，来获取多模态感知能力。典型的该类模型有 Flamingo、BLIP、LLaVA、MiniGPT4 等。这些模型可以处理图片输入，根据用户的问题生成相应的文本回复。然而，研究发现尽管这些模型表现出不错的多模态理解能力，但是存在严重的视觉幻觉问题 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

东莞本地宝 · 11:00！2025东莞超级草莓音乐节即将开票！附周边演唱会排期表

昨天

东南网莆田站 · 张韶涵、苏有朋、杨宗纬、萧敬腾喊你来莆田！

昨天

东南网莆田站 · 张韶涵、苏有朋、杨宗纬、萧敬腾喊你来莆田！

昨天

岳阳晚报社 · 多图直击！今夜，岳阳这里嗨爆了！

2 天前

岳阳晚报社 · 多图直击！今夜，岳阳这里嗨爆了！

2 天前

福建省文化和旅游厅 · 今日开播！央视《乐在旅途》第三季福建泉州站踏春而来！

2 天前

福建省文化和旅游厅 · 今日开播！央视《乐在旅途》第三季福建泉州站踏春而来！

2 天前

江南都市报 · 知名歌手王蓉被淘汰引热议，本人回应：盼了“浪姐”6年，没想到一轮游

3 天前

江南都市报 · 知名歌手王蓉被淘汰引热议，本人回应：盼了“浪姐”6年，没想到一轮游

3 天前

环球旅讯 · 早鸟优惠最后6天 |【智游·美国】环球旅讯硅谷智库游学考察团火热报名中

8 月前

中信建投证券研究 · 中信建投｜汽车：内需与出口共振，成长与龙头共受益

6 月前

左右为篮 · 重磅！不止唐斯！森林狼再走一核心？

6 月前

成都本地宝 · 90后、00后也爱取这个名字！成都排前三的竟然是……

6 月前

冷丫 · “盘点那些神级救场名场面...！”这么聪明可以替我上班吗？

4 月前