注册登录

专栏名称: 架构师带你玩转AI

分享人工智能，让所有人玩转AI

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

蒲公英Ouryao · 小儿感冒宁颗粒等3药品转换非处方药公示 · 3 天前

丁香园 · 中国大陆首例！4 岁女童就诊 177 ... · 3 天前

医学影像沙龙 · 女性盆腔MRI及CT诊断 · 3 天前

梅斯医学 · 热议！61岁乘客飞机上昏迷，广播寻找医生，却 ... · 4 天前

今天看啥 › 专栏 › 架构师带你玩转AI

无法解释LLM的智能涌现，可以从神经元的基本原理入手

架构师带你玩转AI · 公众号 · · 2024-08-26 23:16

文章预览

神经网络的重要参数大模型如Llama 3.1 8B、70B、405B（即80亿、700亿、4050亿参数）中的这些几十亿、几百亿、几千亿的参数主要是指模型中所有可训练的权重和偏置的总和，这些参数分布在模型的各个层、节点和组件中，用于学习数据的复杂表示并生成预测结果。 “大力出奇迹”，即“Scalling Law”：在保持模型架构和训练策略不变的情况下，通过简单地增加模型的参数数量、训练数据量或计算资源，可以在一定程度上提升模型的性能。这种趋势在多个大型语言模型的实验中都得到了验证，表明在当前的技术水平下，参数规模的增长仍然是推动模型性能提升的重要因素。能够大力出奇迹，可能来源于大模型是由无数简单的神经元构成，就像蜂群由无数工蜂组成。越是简单的个体，不断叠加个体的数量，一定会量变到质变，产生智能涌现。这一切的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

蒲公英Ouryao · 小儿感冒宁颗粒等3药品转换非处方药公示

3 天前

丁香园 · 中国大陆首例！4 岁女童就诊 177 次，真正的患者原来是母亲

3 天前

医学影像沙龙 · 女性盆腔MRI及CT诊断

3 天前

梅斯医学 · 热议！61岁乘客飞机上昏迷，广播寻找医生，却无人回应，最终离世！川航回复：飞机上确实没有医生，也没人出面！要让医生敢于救人！！

4 天前

PowerBI星球 · 双11特惠，不要错过~

3 月前

BlueNote爵士乐俱乐部 · Bossa Nova风情之夜：Celeste Caramanna 初登 Blue Note 中国舞台

2 月前

酒管财经 · 2025才到2月份，已有近20家中小酒管走向破产丨“调改”酒店①

1 周前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号