o1模型意味着预训练Scaling-law不存在了？

数字游牧日常 · 公众号 · · 2024-09-24 07:12

文章预览

如果时间退回到2017年，AlphaGo震撼全球，紧接着，虽然AlphaZero具备更强的能力，从技术而言更令人“胆寒”，但引起的震撼却不如AlphaGo了。同样的故事发生在了2023年的ChatGPT，GPT-4和一周多前的o1模型。不仅仅是因为遭到的待遇，更因为技术演进的路线。如果说AlphaGO是靠“学遍天下棋局”而“具备”了战胜人类最顶尖选手的能力的话，AlphaZero则是靠“懂得”围棋的基础上“自我对弈”，自己进化的：它现在成为了最好的教练，而人类继续享受自己与自己对的美丽世界。所以： 1、先通过学习海量数据得到基础知识，然后通过不断强化自己具备“真正的博弈能力”； 2、超越人类的智能存在，并没有严重威胁到人类自身；对于GPT系而言，第二点我们暂且放在一边，第一点，几乎也是如此的。一直到GPT-4，被大家熟知的概念都是预训练，transformer，scali ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

春城晚报 · 价格大降！昆明有商家一早上卖掉近500公斤……

9 小时前

掌上春城 · 天塌了！头皮发麻！上班一直在喝蚂蚁泡澡水，细菌超厕所3200倍……

19 小时前

物道 · 無印良品又一爆款！ins风春夏四件套，只要99元？

昨天

昆明发布 · 春日限定！昆明油菜花海上线

昨天

氧叔本叔 · 42岁王心凌嫩出新高度？又甜又欲的身材好似刚剥壳的鸡蛋…

2 天前

BioArtMED · 欢迎投稿丨Cancer Discovery邀请中国肿瘤研究科学家撰写评论文章

9 月前

澳洲妇幼Dr韩 · 孕妈偷吃冰淇淋时胎宝宝是什么反应、这个有风险的驱蚊产品别用……一周科普汇总

8 月前

甲子光年 · 具身智能大火，这场人气爆满的盛会圆满落幕｜甲子光年

7 月前

金融早实习 · ESG交流分享群

5 月前

中国科学地球科学 · 水稻从野生到驯化的轨迹

5 月前