为了活下去，大模型“六小虎”走向分野

字母榜 · 公众号 · 科技自媒体 · 2024-10-17 18:17

主要观点总结

本文讨论了国内AI公司在预训练大模型路线选择上的变化。一些公司开始放弃预训练模型，转向AI应用。文章介绍了预训练模型的重要性以及放弃预训练模型背后的原因，包括资金、算力紧缺，技术瓶颈和营销压力等因素。同时，文章也提到了模型层企业放弃预训练的影响以及AI行业的未来趋势。

关键观点总结

关键观点1: 国内AI公司开始放弃预训练模型，转向AI应用。

由于资金、算力紧缺等问题，一些AI公司开始重新评估自身能力和资源现状，选择放弃预训练模型，专注于让模型更懂用户的“后训练”环节。这是节省算力成本考量下的正常趋势。

关键观点2: 预训练模型的重要性。

预训练模型是AI模型的基础教育阶段，赋予模型海量而通用的知识，是决定模型性能最关键的阶段。但随着第三方预训练模型的性能提高，应用层企业逐步放弃预训练模型，专注于让模型更懂用户的‘后训练’环节。

关键观点3: 放弃预训练模型的影响。

模型层企业放弃预训练模型，意味着主动走下AGI竞速的牌桌。这反映了AI技术的泡沫和盲目跟随的现象。但从另一方面看，这也是资源紧缺的当下，最具性价比的决定。模型厂商开始重视用户数据，将其作为留在AI牌桌上的筹码。

关键观点4: AI行业的未来趋势。

随着技术的发展和市场的变化，AI行业将面临新的挑战和机遇。放弃预训练模型并不意味着全盘消极，而是厂商在追赶AGI之前，先选择了活下去。未来80%的公司可能会放弃预训练，硅谷逐渐形成的共识是RL（强化学习）是接下来的突破点。

文章预览

文｜周鑫雨编辑｜苏建勋转载自 | 智能涌现（ID:AIEmergence） 2024年，不少曾立下“做中国OpenAI”军令状的模型公司，开始打脸。据《智能涌现》了解，被称为“AI六小虎”的6家中国大模型独角兽中，已经有两家逐步放弃预训练模型，缩减了预训练算法团队人数，业务重心转向AI应用。（本文希望重点讨论国内AI公司对“预训练”大模型的路线选择，及其背后的思考与后续侧重点，为了不引起不必要的纷争，遂隐去放弃预训练模型的企业名称。）赶大模型早集的百度，9月也一度传出“大概率放弃通用基础大模型研发，主要做应用”的消息。即便后续被百度辟谣，但“放弃预训练模型”，已经成了行业的一个转折点。可以说，能让厂商上大模型牌桌的，就是“预训练”。所谓的“预训练（pre-train）”，就好比大模型的基础教育阶段，赋予 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博