文章预览
摘要 事件: 北京时间9月13日凌晨,OpenAI发布全新大模型OpenAI o1系列,根据官方说法,与之前的模型相比,o1系列模型可以推理更复杂的任务,解决更难的问题。同时该系列大模型的命名也有深意,OpenAI表示,对于复杂推理任务来说,该系列模型的推出是一个重要的进展,代表了人工智能能力的新水平,因此将计数器重置为1,并将这一系列命名为OpenAI o1。 【o1最核心的“升级”:进一步拟人、强化“自我”能力】 相较于传统GPT系列大模型,o1大模型最核心的变化在于“自我反思和提升”,通过让渡速度来提升回答的“聪明”程度。 OpenAI 采用强化学习(RL,Reinforcement Learning)的方法来训练o1,目标在于让大模型尽可能模拟人类的思考过程,在回答问题时,模型会自我进行思考,形成长串的思维链,在花费一定时间(而不是立马给出回答)后,判断
………………………………