专栏名称: 智源社区
【智源社区】是北京智源人工智能研究院打造的一个内行、开放的 AI 实名社区,致力于促进 AI 交流。
今天看啥  ›  专栏  ›  智源社区

Sora 团队负责人 Aditya Ramesh 对话谢赛宁丨压缩一切!视觉与语言模态的融合

智源社区  · 公众号  ·  · 2024-06-14 18:46
    

文章预览

2024 年 6 月 14 日,一年一度的智源大会又迎来重磅嘉宾。 当红视频生成大模型「Sora」团队的负责人 Aditya Ramesh 在2024智源大会开幕式上发表了题为「Language as the Scaffolding for Visual Intelligence」的主旨演讲。他介绍了生成式建模领域近年来的发展历程以及未来的前进方向, 分享了 OpenAI 从研发 DALL·E、iGPT、CLIP 到 Sora 的一次次研究指导思想的转变,讲述其团队为何一步步将生成式模型做向极致。 站在人工智能 3.0 的拐点,Aditya Ramesh 的宝贵经验具有巨大的启发意义。   即刻扫码注册,参与第二日大会报名 下面是智源社区对 Aditya Ramesh 演讲主要内容的编译:   大模型初探:DALL·E——扩展模型规模的启示 2021 年 2 月,我们发布了著名的「文生图」人工智能系统 DALL·E,它是一个同时使用文本和量化压缩后的图像以自回归方式训练的 Transformer 模型。该系统 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览