这里是AI领域学习交流的平台!分享人工智能、机器学习、深度学习、计算机视觉、自然语言处理、算法原理、科技前沿、行业动态等,为您提供最有价值的知识和资讯。
今天看啥  ›  专栏  ›  人工智能与算法学习

GPT-4o、SAM、DiT、DCN、SegGPT 作者共话多模态模型前沿进展 | 2024智源大会精彩回顾

人工智能与算法学习  · 公众号  ·  · 2024-06-25 09:11
    

文章预览

来源:智源社区 「多模态领域应该选哪些技术路线?视觉领域遵循scaling law么?如何看待“Encoder不可能三角”?未来训练多模态大模型的数据形式应该是怎样的?」 2024 年 6 月 15 日,智源大会第二天, GPT-4o、SAM、DiT、SegGPT、DCN 等重磅工作的作者 共聚「多模态大模型」论坛,将本届智源大会的热度推向了高潮。嘉宾们介绍了多模态大模型领域最新的研究进展,分享了他们的经典名作和最新工作背后的思路和心得。 论坛干货满满,参会者热情高涨,全场座无虚席。 以下是核心内容整理: 论坛回放: https://event.baai.ac.cn/live/799 王鑫龙:生成式多模态模型 王鑫龙 | 智源研究院视觉模型研究中心负责人 人类处于由语言和视觉等多种模态构成的环境中,时刻接收多模态的上下文。人类依赖多模态的上下文理解能力完成日常任务。在语言模型领域,GPT系列 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览