专栏名称: 第一财经YiMagazine
这里是《第一财经周刊》读者俱乐部,我们为你发掘精彩的商业价值,也邀请你一起探寻明亮的商业世界。
今天看啥  ›  专栏  ›  第一财经YiMagazine

智能周报|向o1模型学习

第一财经YiMagazine  · 公众号  · 财经  · 2024-11-17 22:12

主要观点总结

本文主要介绍了科技公司动态,包括模型能力提升速度放缓、新产品与模型发布、人事变动等内容。

关键观点总结

关键观点1: 模型能力提升速度放缓

OpenAI的旗舰模型Orion效果不及预期,规模定律可能失效。Google的Gemini团队也爆出了类似消息。这些公司正在尝试把精力从预训练转移到后训练,专注于提升模型在实际应用场景中的表现。

关键观点2: 新产品与模型发布

百度推出自然语言编程工具「秒哒」和小度AI眼镜。OpenAI计划明年发布可操控电脑的智能体「Operator」。Google也在开发类似的产品。此外,还有新产品如生数科技发布视频模型Vidu 1.5版本等。

关键观点3: 人事变动

OpenAI前首席技术官Murati组建新团队,不少成员来自OpenAI。月之暗面两位产品经理离职创业,正在接触投资人。


文章预览

撰文 | 新皮层小组 编辑 |  王杰夫 在基础模型能力提升降速的传言持续了半年后,本周终于听到了来自这些AI公司内部的消息。 先是有OpenAI员工爆料,公司的下一代旗舰模型Orion的效果不及预期,至少这一次的提升效果,要远逊于当初GPT-3和GPT-4之间的差距。这意味着此次大模型浪潮的核心假设——规模定律(scaling law)即将失效,即投入更多数据、更多算力去训练,模型能力却无法提升更多。 随后Google的Gemini团队也爆出了类似的消息,中国AI创业公司月之暗面甚至在本周六匆忙召开发布会表达了类似的观点。 当然,这些公司还是要找出路的,既然基础模型的提升有限,那就试试把精力放在优化模型上——也就是从预训练向后训练转移。一般来说,「预训练」(pre-training)指的是从零开始训练超大规模的基础模型,主要是为了提升模型的基础能力和 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览