专栏名称: 图灵人工智能
人工智能及其他科技学术前沿、机器学习、图像识别、语音识别、自动驾驶、自然语言处理、脑机接口、云计算、大数据、物联网、机器人、天文物理、生物科学、数学、区块链、比特币、计算机等学术前沿知识、报告、讲座等介绍。
今天看啥  ›  专栏  ›  图灵人工智能

图灵奖得主LeCun、谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V

图灵人工智能  · 公众号  ·  · 2024-06-28 00:00
    

文章预览

单击上方“ 图灵人工智能 ”,选择“星标”公众号 您想知道的人工智能干货,第一时间送达   转自 新智元 编辑:编辑部 【导读】 近日, LeCun 和谢赛宁等大佬,共同提出了这一种全新的SOTA MLLM——Cambrian-1。开创了以视觉为中心的方法来设计多模态模型,同时全面开源了模型权重、代码、数据集,以及详细的指令微调和评估方法。 在寒武纪大爆发中,视觉的出现对于早期动物至关重要。 捕食、避险、引导进化, 穿越时间,组成了多彩的世界。 大多数人类知识,也都是通过视觉、听觉、触觉、味觉和嗅觉等感官体验,以及与物理世界的交互所获得。 对应到大模型的学习,虽然更大的规模可以增强多模态的能力,但视觉方面的研究和设计似乎没有跟上。 另一方面,过度依赖语言,则可能会成为多模态学习研究的瓶颈。 近日,LeCun和谢赛宁团队推 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览