专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

OpenAI o1技术原理猜想汇总

AINLP · 公众号 · · 2024-10-18 18:18

文章预览

背景自从OpenAI o1发布以来，目前尚没有OpenAI没有公开其技术方案，本文汇总了目前关于o1背后关键技术的猜想及相关工作。 1. 基于Prompt prompt-based ：通过prompt的方法让其通过 step by step reasoning & self-correcting 1.1 CoT Chain-of-Thought Prompting Elicits Reasoning in Large Language Models: https://arxiv.org/pdf/2201.11903 介绍了"思维链提示"(chain-of-thought prompting)方法，这是一种通过在提示中加入中间推理步骤来提高大型语言模型复杂推理能力的技术。 CoT要求 LLM 展示其内部推理流程（例如，“让我们一步一步思考”） CoT 的一个变体是“CoT elf-consistency（自洽性）”，即并行采样多个 CoT 轨迹并使用多数投票来找到“正确”的答案。实验证明，思维链提示显著提升了模型在算术、常识和符号推理任务上的表现。特别是在GSM8K数学问题基准测试中，使用此方法的PaLM 540B模型达到了新 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

天天看余杭 · 噩耗传来！歌手方大同去世，年仅41岁

4 小时前

天天看余杭 · 噩耗传来！歌手方大同去世，年仅41岁

4 小时前

话匣子 · 知名歌手方大同去世，年仅41岁！曾在上海生活过……

4 小时前

话匣子 · 知名歌手方大同去世，年仅41岁！曾在上海生活过……

4 小时前

新晚报 · 接吻时长世界纪录保持者夫妇分手，曾连续吻了……

昨天

新晚报 · 接吻时长世界纪录保持者夫妇分手，曾连续吻了……

昨天

羊城派 · 38岁杨幂自曝！

3 天前

羊城派 · 38岁杨幂自曝！

3 天前

华策影视 · “2025酷云数娱年度影响力盛典”年度榜单发布《承欢记》《我是刑警》《锦绣安宁》获多项大奖

3 天前

老井扯鸡蛋 · 增强蛋鸡免疫力！从鱼肝油开始！蓝肽浓缩鱼肝油推荐给您！

7 月前

内蒙古工业大学 · 我校组织召开自治区科学技术奖励申报论证会

4 月前

洪灝的宏观策略 · 2024 - 再次荣获第一财经年度机构首席经济学家奖。 -20241128131342

3 月前

987私家车广播 · 泰国：平均每日约1.7万中国游客抵泰，上周环比增9.3%，新游客提前预订量有所减少

1 月前

程序员的那些事 · 奥特曼：在开源 AI 上，我们错了！DeepSeek 让 OpenAI 优势不再，下一个是 GPT-5

4 周前