专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

OpenAI 的 o1 究竟是如何工作的?第 2 部分。以下是我-20241016140544

斌叔OKmath  · 微博  ·  · 2024-10-16 14:05

文章预览

2024-10-16 14:05 本条微博链接 OpenAI 的 o1 究竟是如何工作的?第 2 部分。以下是我最近阅读的关于 LLM 推理的论文和摘要列表。全部基于学习。 0) STaR:自学推理机 网页链接 归零点。不必总是提示 CoT,而是将其融入默认模型行为中。给定一个(问题,答案)对的数据集,手动整理一些 CoT 跟踪并将它们用作少数样本示例,以生成(理由,答案)三元组(给定一个问题),用于其余数据集(“引导推理”)。对(问题,理由, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览