专栏名称: CVer

一个专注侃侃计算机视觉方向的公众号。计算机视觉、图像处理、机器学习、深度学习、C/C++、Python、诗和远方等。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

深蓝财经 · 腾讯狂砸90亿，再次证实它本质更是游戏公司 · 昨天

渭南最生活 · 热搜爆了！王者荣耀崩了，官方回应→ · 昨天

独立出海联合体 · 育碧将成立子公司独立运作几大金牌IP，腾讯持 ... · 昨天

金铲铲阿助 · 轻松上手S14，赛季核心机制详解！ · 2 天前

今天看啥 › 专栏 › CVer

贾扬清：大模型尺寸正在重走CNN的老路！马斯克：在特斯拉也是这样...

CVer · 公众号 · · 2024-08-02 23:59

文章预览

点击下方卡片，关注“ CVer ”公众号 AI/CV重磅干货，第一时间送达点击进入—> 【Mamba/多模态/扩散】交流群添加微信号：CVer111，小助手会拉你进群！扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea 和 CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！衡宇发自凹非寺转载自：量子位（QbitAI） Transformer大模型尺寸变化，正在重走CNN的老路！看到大家都被LLaMA 3.1吸引了注意力，贾扬清发出如此感慨。拿大模型尺寸的发展，和CNN的发展作对比，就能发现一个明显的趋势和现象：在ImageNet时代，研究人员和技术从业者见证了参数规模的快速增长，然后又开始转向更小、更高效的模型。听起来，是不是和GPT哐哐往上卷模型参数，业界普遍认同Scaling Law，然后出现GPT-4o mini、苹果DCLM-7B、谷歌Gemma 2B如出一 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

深蓝财经 · 腾讯狂砸90亿，再次证实它本质更是游戏公司

昨天

深蓝财经 · 腾讯狂砸90亿，再次证实它本质更是游戏公司

昨天

渭南最生活 · 热搜爆了！王者荣耀崩了，官方回应→

昨天

渭南最生活 · 热搜爆了！王者荣耀崩了，官方回应→

昨天

独立出海联合体 · 育碧将成立子公司独立运作几大金牌IP，腾讯持股25%

昨天

独立出海联合体 · 育碧将成立子公司独立运作几大金牌IP，腾讯持股25%

昨天

金铲铲阿助 · 轻松上手S14，赛季核心机制详解！

2 天前

金铲铲阿助 · 轻松上手S14，赛季核心机制详解！

2 天前

气象北京 · 森林体验指数预报（2024-7-14）

8 月前

新零售 · 重回富豪榜前十的王健林，又卖了几个万达广场

8 月前

诡不言 · 7个冰层中的奇怪发现！

2 周前