专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

240万亿巨量数据被洗出，足够训出18个GPT-4！全球23所机构联手，清洗秘籍公开

新智元 · 公众号 · AI · 2024-06-24 13:28

文章预览

新智元报道编辑：编辑部【新智元导读】是时候把数据Scale Down了！Llama 3揭示了这个可怕的事实：数据量从2T增加到15T，就能大力出奇迹，所以要想要有GPT-3到GPT-4的提升，下一代模型至少还要150T的数据。好在，最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了，但你有卡吗？是时候把数据Scale Down了！如今，这个问题已经迫在眉睫。清华博士秦禹嘉表示，Llama 3就揭示了一个严峻且悲观的现实：在不改变模型架构的情况下，将数据量从2万亿（2T）增加到15万亿（15T），就能大力出奇迹。这也就意味着，从长远来看，基座模型的发展机会，只能独属于大公司。而考虑到Scalng Law的边际效应，如果我们希望在下一代模型身上看到从GPT-3到GPT-4级别的演进，就需要至少再清洗出至少10个数量级的数据（比如150T）。就在最近，好消息来 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · 曾经很多人认为“提示工程师”会是未来一个重要的职业，但现在看来，-20241223025033

5 小时前

黄建同学 · 是的，未来AI眼镜也会越来越智能重要！//@观察家家中观察:实时-20241222215446

10 小时前

宝玉xp · 发一个投票：这次 OpenAI 的连续 12 天 AI 直播发布-20241222091825

22 小时前

爱可可-爱生活 · 晚安～ #晚安# -20241219223518

3 天前

爱可可-爱生活 · 几篇论文实现代码：《OAKINK2: A Dataset of -20241219135657

3 天前

蔚来(微博搜索) · 蔚来(微博搜索)-20240707-2

5 月前

模玩熊 · 【7.25补款】 FREEing figma 剑风传奇费蒙特暗之鹰诞生手办开启补款！

5 月前

经济学原理 · 美联储可以等待

4 月前

山东大学爱心协会 · 纳新|爱聚青春,心迎你来(转发推文参与抽奖)

2 月前