注册
登录
专栏名称:
宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
《爱可可微博热门分享(9.17)》 ...
·
昨天
爱可可-爱生活
·
【ShellAgent:功能强大、开放且模块 ...
·
昨天
爱可可-爱生活
·
【extension.js:即插即用、零配置 ...
·
3 天前
黄建同学
·
必须搞一个!//@王小裤子:所有人都应该试着 ...
·
4 天前
人工智能那点事
·
唐尚珺的大学室友全部申请搬离宿舍?最新回应→
·
4 天前
今天看啥
›
专栏
›
宝玉xp
去年 Jim Fan 有一个对传闻中 Q* 的预测(网页链接),-20240916063549
宝玉xp
·
微博
·
AI
· 2024-09-16 06:35
文章预览
2024-09-16 06:35 本条微博链接 去年 Jim Fan 有一个对传闻中 Q* 的预测( 网页链接 ),现在结合刚发布的 o1 来看基本上都是准确的! Jim 将 Q* 和 AlphaGo 做了类比,猜测 Q* 可能类似于 AlphaGo,是通过与自己之前的版本进行对弈,自我对弈不断进步,甚至于架构都是类似的。 AlphaGo 的架构核心有四个组件: 1. 策略神经网络(Policy NN,学习部分):负责选择下一步最有可能赢的走法 2. 价值神经网络(Value NN,学习部分):评估当前 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
《爱可可微博热门分享(9.17)》 爱可可微博热门分享(9.1-20240917225310
昨天
爱可可-爱生活
·
【ShellAgent:功能强大、开放且模块化的Agentic框-20240917212739
昨天
爱可可-爱生活
·
【extension.js:即插即用、零配置、跨浏览器的扩展开发-20240915164426
3 天前
黄建同学
·
必须搞一个!//@王小裤子:所有人都应该试着训练自己的大模型。-20240914210843
4 天前
人工智能那点事
·
唐尚珺的大学室友全部申请搬离宿舍?最新回应→
4 天前