专栏名称: 新皮层NewNewThing
关注人工智能与人类智能。
今天看啥  ›  专栏  ›  新皮层NewNewThing

大模型的秋天来了吗?

新皮层NewNewThing  · 公众号  ·  · 2024-09-30 20:00

主要观点总结

本文主要介绍了OpenAI发布的新一代语言模型o1,其拥有强大的推理能力,采用了全新的命名方式。通过列举其在多个竞赛中的表现,展示了其超高的准确率。文章还提到o1模型的推理能力提升的关键是引入“思维链”方案,但这也导致了其资源占用更多、更贵以及回答速度更慢。此外,文章也讨论了当前大模型领域的一些现状,包括基座模型能力的瓶颈、融资金额与估值的膨胀、创业公司与风险投资的蜜月期结束等问题。同时,文章还提及了其他公司如苹果、华为和字节跳动在AI领域的动态。

关键观点总结

关键观点1: OpenAI发布新模型o1,具备强大的推理能力,并在多个竞赛中表现优异。

o1模型采用了全新的命名方式,是AI能力的新水平。其推理能力通过引入“思维链”方案实现,但这也导致了其资源占用更多、更贵以及回答速度更慢。

关键观点2: 大模型领域现状存在基座模型能力的瓶颈,融资金额与估值膨胀。

尽管OpenAI等公司在AI领域取得进展,但目前大模型的能力仍面临停滞不前的局面。与此同时,这些公司的融资金额与估值却在不断膨胀。

关键观点3: 创业公司与风险投资的蜜月期结束,大公司更注重积累人才以保持基座模型的领先。

现在许多大公司通过雇佣收购来积累人才,以保持基座模型的领先。创业公司则面临如何活下去的挑战。

关键观点4: 苹果和华为在AI领域的动态,苹果将AI植入手机并提供个性化服务,而华为则推出新型硬件产品吸引关注。

苹果将AI模型植入手机并展示了更多的实际用例,而华为则通过推出新型硬件产品来吸引关注。这也反映了用户对于新鲜硬件形态的兴趣远远超过对AI功能的兴趣。


文章预览

记者:王杰夫 编辑:吴洋洋 在冬季到来前,大模型领域的创业者们终于等来了OpenAI的新模型。 9月13日,OpenAI发布新一代语言模型o1。这款模型不属于GPT系列,而是采用了全新的命名方式,官方对此的解释是:“对于复杂的推理任务来说,这是一次重大进步,代表了AI能力的一个新水平。因此,我们将计数器重置为1,并将这个模型系列命名为OpenAI o1。” 为了展现o1模型的推理能力,OpenAI列出了它在AIME、Codeforces、GPQA这3个美国著名竞赛(涵盖数学、计算机、物理、化学、生物等)中的考试成绩,正确率基本都在80%以上,不仅远超GPT-4o模型的表现(GPT-4o在这些考试中的准确率最低只有11%,最高也不过56%),甚至也超过人类博士的平均水平。不过,知名数学家、同时也是ChatGPT资深使用者的陶哲轩在第一时间试用o1后表示,这是一个“水平一般但不算太无 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览