专栏名称: 天翼智库
天翼智库是中国电信研究院战略发展研究所承办的面向公众的智库研究信息发布平台,为您提供最新信息通信行业发展动态、政策观察、产业分析和战略洞察等。
今天看啥  ›  专栏  ›  天翼智库

OpenAl o1大模型:原理、突破、前景及影响

天翼智库  · 公众号  ·  · 2024-09-14 07:00

文章预览

北京时间2024年9月13日凌晨,OpenAI正式发布了新的人工智能模型o1(o是orion猎户座,1代表从头再来,也意味着后续将出现更多序列),就是此前OpenAI一直在高调宣传的草莓大模型。OpenAI没有延续使用GPT序列,可见其与传统预训练模型有新的变革性训练方法和功能,o1具备复杂推理能力,解决比目前专业的科学、代码和数学模型所能解决的更难的问题。值得注意的是,相比GPT-4o等其他大模型, o1推理时间较长、使用成本更高,在不需要复杂推理的场景并没有明显优势,也意味着o1并非GPT-4o的替代品,两者将并存,未来不排除实现融合。 基本原理:自我对弈强化学习+思维链+推理标记+定制数据集 一是采用大规模自我对弈强化学习 (Self-play RL) ,设置奖惩机制,让模型自行学习解决问题。这种方法类似于人类通过不断尝试和纠错来掌握新技能。二是内置 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览