大模型的秋天来了吗？

新皮层NewNewThing · 公众号 · · 2024-09-30 20:00

主要观点总结

本文主要介绍了OpenAI发布的新一代语言模型o1，其拥有强大的推理能力，采用了全新的命名方式。通过列举其在多个竞赛中的表现，展示了其超高的准确率。文章还提到o1模型的推理能力提升的关键是引入“思维链”方案，但这也导致了其资源占用更多、更贵以及回答速度更慢。此外，文章也讨论了当前大模型领域的一些现状，包括基座模型能力的瓶颈、融资金额与估值的膨胀、创业公司与风险投资的蜜月期结束等问题。同时，文章还提及了其他公司如苹果、华为和字节跳动在AI领域的动态。

关键观点总结

关键观点1: OpenAI发布新模型o1，具备强大的推理能力，并在多个竞赛中表现优异。

o1模型采用了全新的命名方式，是AI能力的新水平。其推理能力通过引入“思维链”方案实现，但这也导致了其资源占用更多、更贵以及回答速度更慢。

关键观点2: 大模型领域现状存在基座模型能力的瓶颈，融资金额与估值膨胀。

尽管OpenAI等公司在AI领域取得进展，但目前大模型的能力仍面临停滞不前的局面。与此同时，这些公司的融资金额与估值却在不断膨胀。

关键观点3: 创业公司与风险投资的蜜月期结束，大公司更注重积累人才以保持基座模型的领先。

现在许多大公司通过雇佣收购来积累人才，以保持基座模型的领先。创业公司则面临如何活下去的挑战。

关键观点4: 苹果和华为在AI领域的动态，苹果将AI植入手机并提供个性化服务，而华为则推出新型硬件产品吸引关注。

苹果将AI模型植入手机并展示了更多的实际用例，而华为则通过推出新型硬件产品来吸引关注。这也反映了用户对于新鲜硬件形态的兴趣远远超过对AI功能的兴趣。

文章预览

记者：王杰夫编辑：吴洋洋在冬季到来前，大模型领域的创业者们终于等来了OpenAI的新模型。 9月13日，OpenAI发布新一代语言模型o1。这款模型不属于GPT系列，而是采用了全新的命名方式，官方对此的解释是：“对于复杂的推理任务来说，这是一次重大进步，代表了AI能力的一个新水平。因此，我们将计数器重置为1，并将这个模型系列命名为OpenAI o1。” 为了展现o1模型的推理能力，OpenAI列出了它在AIME、Codeforces、GPQA这3个美国著名竞赛（涵盖数学、计算机、物理、化学、生物等）中的考试成绩，正确率基本都在80%以上，不仅远超GPT-4o模型的表现（GPT-4o在这些考试中的准确率最低只有11%，最高也不过56%），甚至也超过人类博士的平均水平。不过，知名数学家、同时也是ChatGPT资深使用者的陶哲轩在第一时间试用o1后表示，这是一个“水平一般但不算太无 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博