专栏名称: 图灵人工智能

人工智能及其他科技学术前沿、机器学习、图像识别、语音识别、自动驾驶、自然语言处理、脑机接口、云计算、大数据、物联网、机器人、天文物理、生物科学、数学、区块链、比特币、计算机等学术前沿知识、报告、讲座等介绍。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

谢赛宁：AI是否需要更强的视觉基础来实现理解和意义?

图灵人工智能 · 公众号 · · 2024-06-21 00:00

文章预览

单击上方“ 图灵人工智能 ”，选择“星标”公众号您想知道的人工智能干货，第一时间送达 6 月 15 日，万众瞩目的智源大会「多模态大模型」论坛轰动举行。纽约大学助理教授谢赛宁从哲学的角度出发，针对大语言时代的视觉表征研究娓娓道来。从探索多模态大型语言模型的视觉缺陷、基于视觉搜索引导的多模态大模型、真实世界中的虚拟智能落地等方面介绍了团队的最新工作。通过这些工作，读者们可以窥见MLLM 的未来风向。人工智能是否需要感知基础来实现理解？实际上，早在 1990 年，Stevan Harnad 就讨论了符号基础的问题。那时，深度学习还没诞生。人们认为，只有当我们为人类语言或计算机代码赋予某种感知基础，这些符号才有意义。 AI 要阻止出现「语义鸿沟」：通常人们在判别图像的相似性时并非建立在图像底层视觉特征的相似上 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博