主要观点总结
本文讨论了国内AI公司在预训练大模型路线选择上的变化。一些公司开始放弃预训练模型,转向AI应用。文章介绍了预训练模型的重要性以及放弃预训练模型背后的原因,包括资金、算力紧缺,技术瓶颈和营销压力等因素。同时,文章也提到了模型层企业放弃预训练的影响以及AI行业的未来趋势。
关键观点总结
关键观点1: 国内AI公司开始放弃预训练模型,转向AI应用。
由于资金、算力紧缺等问题,一些AI公司开始重新评估自身能力和资源现状,选择放弃预训练模型,专注于让模型更懂用户的“后训练”环节。这是节省算力成本考量下的正常趋势。
关键观点2: 预训练模型的重要性。
预训练模型是AI模型的基础教育阶段,赋予模型海量而通用的知识,是决定模型性能最关键的阶段。但随着第三方预训练模型的性能提高,应用层企业逐步放弃预训练模型,专注于让模型更懂用户的‘后训练’环节。
关键观点3: 放弃预训练模型的影响。
模型层企业放弃预训练模型,意味着主动走下AGI竞速的牌桌。这反映了AI技术的泡沫和盲目跟随的现象。但从另一方面看,这也是资源紧缺的当下,最具性价比的决定。模型厂商开始重视用户数据,将其作为留在AI牌桌上的筹码。
关键观点4: AI行业的未来趋势。
随着技术的发展和市场的变化,AI行业将面临新的挑战和机遇。放弃预训练模型并不意味着全盘消极,而是厂商在追赶AGI之前,先选择了活下去。未来80%的公司可能会放弃预训练,硅谷逐渐形成的共识是RL(强化学习)是接下来的突破点。
文章预览
文|周鑫雨 编辑|苏建勋 转载自 | 智能涌现(ID:AIEmergence) 2024年,不少曾立下“做中国OpenAI”军令状的模型公司,开始打脸。 据《智能涌现》了解,被称为“AI六小虎”的6家中国大模型独角兽中,已经有两家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。 (本文希望重点讨论国内AI公司对“预训练”大模型的路线选择,及其背后的思考与后续侧重点,为了不引起不必要的纷争,遂隐去放弃预训练模型的企业名称。) 赶大模型早集的百度,9月也一度传出“大概率放弃通用基础大模型研发,主要做应用”的消息。即便后续被百度辟谣,但“放弃预训练模型”,已经成了行业的一个转折点。 可以说,能让厂商上大模型牌桌的,就是“预训练”。所谓的“预训练(pre-train)”,就好比大模型的基础教育阶段,赋予
………………………………