注册登录

专栏名称: AI科技评论

点评学术，服务 AI ！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

慧田哲学 · 谢林：哲学是使人不致绝望的学问 · 5 小时前

湘微教育 · 官宣！中南大学各校区改名了！ · 昨天

福建教育微言 · 福建公布2027年起拟在闽招生的普通高校本科 ... · 昨天

哲学园 · 过年，打一场大统一理论的扑克牌局 · 2 天前

今天看啥 › 专栏 › AI科技评论

大模型隐藏玩家上桌：DeepSeek 向左，面壁向右

AI科技评论 · 公众号 · · 2025-01-16 16:48

文章预览

他们正在打样「榨干」有限算力的极致解法。作者丨朱可轩编辑丨陈彩娴大模型赛跑两年后，玩家已逐步分化为三种趋势：一类玩家仍追随 OpenAI 的脚步卷大参数基座模型，另外一类烧不起钱的玩家转头拥抱应用端，而第三类则自始至终都在摸索如何更高效打造出性能更优的模型。目前，第一类卷向大参数的玩家也都在寻找高效解决方案，连 OpenAI 此前发布 GPT-4o mini 切入小模型市场，Meta Llama 3.1-8B、微软 Phi-3-vision 和 Phi-4 14B 、谷歌 Gemma 2 以及阿里 Qwen 2.5 等一系列小模型也都是头部玩家在做的布局。算力存在上限已是不争的事实，而且也并非参数越大就意味着效果一定能达到预期，更何况，如若如果每增长一倍参数规模，效果能力却并未呈一倍增长，大模型发展起来会很慢： OpenAI 能用百千亿达到 GPT-4 的水平，其他家则可能需要投入更多资源， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

慧田哲学 · 谢林：哲学是使人不致绝望的学问

5 小时前

湘微教育 · 官宣！中南大学各校区改名了！

昨天

福建教育微言 · 福建公布2027年起拟在闽招生的普通高校本科专业选考科目要求

昨天

哲学园 · 过年，打一场大统一理论的扑克牌局

2 天前

哈佛商业评论 · 不烦人的领导，才是员工的心头爱

4 月前

笔记侠 · 中年改命，学会“借运”

3 月前

乌鸦预告片 · 牛逼！9.1神作重磅扎堆！影迷爽疯了！

2 月前

禽报网 · 冷库及车间破损地坪快速修复材料来啦！双汇、正大、金锣等都在用！

1 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号