注册
登录
专栏名称:
歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
每日豆瓣
·
爸妈很担心我在国外看不到新闻联播
·
2 天前
今天看啥
›
专栏
›
歸藏的AI工具箱
Open AI 研究员放出了他去年的一次分享。#ai# 可能刚好-20240920161108
歸藏的AI工具箱
·
微博
· · 2024-09-20 16:11
文章预览
2024-09-20 16:11 本条微博链接 Open AI 研究员放出了他去年的一次分享。 #ai# 可能刚好讲到了可能关于 o1 的核心训练思路。 他的逻辑是 不要“教授”,要激励。 比如涉及 RL 时候常用来举例子的 AlphaGo。 不要告诉模型如何才能赢得棋局,而应该引导模型学习什么是好的走法。 强烈推荐听一下,图里是 Claude 的笔记。 原始视频: 网页链接 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
每日豆瓣
·
爸妈很担心我在国外看不到新闻联播
2 天前
灵异社区
·
练气功者野外做了一件错事,直言:“我漏真气了,赶紧走!”
2 月前