专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

关于GPT5训练失败的思考

AINLP · 公众号 · · 2024-09-10 15:50

文章预览

作者：姚广 https://zhuanlan.zhihu.com/p/718513570 1. 大模型：AI仍是硅谷的热门话题，但不如去年狂热硅谷对AI的关注依然持续，但热度有所降低，主要原因是大模型扩展速度的放缓，尤其是训练算力需求的下降。大约3-4周前，谷歌内部在训练Gemini下一代模型（比上一代大10倍，类似GPT-5）时，两次尝试都失败了。这也解释了GPT-5的发布延迟。目前，硅谷普遍认为，在LLM层面，进一步扩大模型规模变得更加困难，主要是因为： MOE（混合专家模型）后的后期训练效果不佳，模型难以收敛数据瓶颈：合成数据的质量远不如互联网搜集的数据因此，不排除GPT-5继续延期的可能性。思考一：在日常使用GPT-4的过程中，我发现其输出在许多场景下已经非常接近“完美”。这里的“完美”并不意味着通用人工智能（AGI）已经实现，而是在现有系统形态下，基于有限的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Marine Sedimentology · NG：南大洋硅藻的碳转移效率比预想的低

昨天

沧海红珊 · “竹”够好玩 I 非遗再次点亮课堂

昨天

知产力 · 第二十五届中国专利奖评审结果公示

3 天前

知产力 · 第二十五届中国专利奖评审结果公示

3 天前

地刊速览 · Nat. Geosci.：硅藻不能有效将碳输送到深海

3 天前

地刊速览 · Nat. Geosci.：硅藻不能有效将碳输送到深海

3 天前

鸾章玉宇 · 4000犹太人，定居河南超1000年，为啥至今还养不熟？排队入籍以色列

5 月前