GPT-4o、SAM、DiT、DCN、SegGPT 作者共话多模态模型前沿进展 | 2024智源大会精彩回顾

人工智能与算法学习 · 公众号 · · 2024-06-25 09:11

文章预览

来源：智源社区「多模态领域应该选哪些技术路线？视觉领域遵循scaling law么？如何看待“Encoder不可能三角”？未来训练多模态大模型的数据形式应该是怎样的？」 2024 年 6 月 15 日，智源大会第二天， GPT-4o、SAM、DiT、SegGPT、DCN 等重磅工作的作者共聚「多模态大模型」论坛，将本届智源大会的热度推向了高潮。嘉宾们介绍了多模态大模型领域最新的研究进展，分享了他们的经典名作和最新工作背后的思路和心得。论坛干货满满，参会者热情高涨，全场座无虚席。以下是核心内容整理：论坛回放： https://event.baai.ac.cn/live/799 王鑫龙：生成式多模态模型王鑫龙 | 智源研究院视觉模型研究中心负责人人类处于由语言和视觉等多种模态构成的环境中，时刻接收多模态的上下文。人类依赖多模态的上下文理解能力完成日常任务。在语言模型领域，GPT系列 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博