注册登录

专栏名称: 歸藏的AI工具箱

互联网科技博主产品设计师、模型设计师、不会代码的独立开发者。关注人工智能、LLM 、 Stable Diffusion 和设计。

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

每日豆瓣 · 爸妈很担心我在国外看不到新闻联播 · 2 天前

今天看啥 › 专栏 › 歸藏的AI工具箱

Open AI 研究员放出了他去年的一次分享。#ai# 可能刚好-20240920161108

歸藏的AI工具箱 · 微博 · · 2024-09-20 16:11

文章预览

2024-09-20 16:11 本条微博链接 Open AI 研究员放出了他去年的一次分享。 #ai# 可能刚好讲到了可能关于 o1 的核心训练思路。他的逻辑是不要“教授”，要激励。比如涉及 RL 时候常用来举例子的 AlphaGo。不要告诉模型如何才能赢得棋局，而应该引导模型学习什么是好的走法。强烈推荐听一下，图里是 Claude 的笔记。原始视频：网页链接 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

每日豆瓣 · 爸妈很担心我在国外看不到新闻联播

2 天前

灵异社区 · 练气功者野外做了一件错事，直言：“我漏真气了，赶紧走！”

2 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号