Sora 团队负责人 Aditya Ramesh 对话谢赛宁丨压缩一切！视觉与语言模态的融合

智源社区 · 公众号 · · 2024-06-14 18:46

文章预览

2024 年 6 月 14 日，一年一度的智源大会又迎来重磅嘉宾。当红视频生成大模型「Sora」团队的负责人 Aditya Ramesh 在2024智源大会开幕式上发表了题为「Language as the Scaffolding for Visual Intelligence」的主旨演讲。他介绍了生成式建模领域近年来的发展历程以及未来的前进方向，分享了 OpenAI 从研发 DALL·E、iGPT、CLIP 到 Sora 的一次次研究指导思想的转变，讲述其团队为何一步步将生成式模型做向极致。站在人工智能 3.0 的拐点，Aditya Ramesh 的宝贵经验具有巨大的启发意义。即刻扫码注册，参与第二日大会报名下面是智源社区对 Aditya Ramesh 演讲主要内容的编译：大模型初探：DALL·E——扩展模型规模的启示 2021 年 2 月，我们发布了著名的「文生图」人工智能系统 DALL·E，它是一个同时使用文本和量化压缩后的图像以自回归方式训练的 Transformer 模型。该系统 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

打坐站桩 · 打坐入静，还是这个方法最好，别看它简单，功效可是不一般（南怀瑾）

2 小时前

又有好物推荐 · 长外套+阔腿裤，长外套+短外套……冬天这样穿真的好看爆了！

5 小时前

PChouse家居画报 · 进门一抹红，点亮106㎡杂货铺小家，乱中有序太好看了~

昨天

相信音乐Bin music · 美好周末正随着的轻快节奏来临用白安《乱七八糟的梦想》重新找回生活的乐趣｜白安2024最新简单快乐单曲各大数位平台已全面上线

6 月前

芝能汽车 · 汽车智能驾驶技术发展深度报告

5 月前