专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
今天看啥  ›  专栏  ›  歸藏的AI工具箱

Open AI 研究员放出了他去年的一次分享。#ai# 可能刚好-20240920161108

歸藏的AI工具箱  · 微博  ·  · 2024-09-20 16:11

文章预览

2024-09-20 16:11 本条微博链接 Open AI 研究员放出了他去年的一次分享。 #ai# 可能刚好讲到了可能关于 o1 的核心训练思路。 他的逻辑是 不要“教授”,要激励。 比如涉及 RL 时候常用来举例子的 AlphaGo。 不要告诉模型如何才能赢得棋局,而应该引导模型学习什么是好的走法。 强烈推荐听一下,图里是 Claude 的笔记。 原始视频: 网页链接 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览