文章预览
划重点: ① 规模定律之后,大模型发展的下一个范式是强化学习。 ② OpenAI o1模型的发布,通过强化学习尝试突破数据墙,并看到计算更多向推理侧增加的趋势。 ③ 决定这一代AI技术的上限,核心是文本模型能力的上限。 ④ AI产品的能力由模型能力的决定,这和互联网时代有本质不同,模型能力不强,产品体验就不会好。 ⑤ AI时代的超级应用,大概率会是一个AI助理。 腾讯科技作者 郭晓静 编辑 郑可君 OpenAI o1的发布,又一次引发了行业内关于大模型进化新范式的讨论。 讨论的焦点是两个公认的大模型进化瓶颈:数据瓶颈——数据不够用了;以及算力瓶颈——3.2万张卡已是目前的天花板。 但o1模型似乎找到了新的出路,它采用强化学习,试图通过更深入的思考和推理来克服这些限制,提高数据质量和计算效率。 针对这一新范式是否能够推动
………………………………