清华汪玉教授团队支招：如何把“大”模型部署到“小”设备上 | Q福利

AI前线 · 公众号 · AI · 2024-07-13 13:30

文章预览

2024 年，由 AI 驱动的 GPT-4o 等应用产品爆红。这些热门产品的广阔应用前景令人振奋，吸引了大量资源投入 AI 的算法研究、数据清洗、算力等方面的基础建设中。这些爆款应用是由大数据训练的大模型支撑的。举例来说，近年来，大语言模型的训练数据和模型的体量迅速增长，从 2017 年发布的有 1.65 亿参数量的 Transformer，到 2020 年发布的有 1750 亿参数量的 GPT-3，再到 2022 年发布的 ChatGPT 应用背后的模型也至少有数百亿参数量。这样的训练数据和模型体量的增长带来了模型能力的提升，让大模型“涌现”出指令跟随、上下文学习等能力，展示出“通用”的生成能力。有目共睹的是，生成式任务的智能算法模型扩大，对算力的需求急剧增加。在这个背景下，高效深度学习领域显得尤为关键，得到了广泛关注。如何将“大”模型（参数量大、计算 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【关于AI与印刷术深度共性的思考】《认知的革命，思维的跃迁：AI-20241125081627

昨天

爱可可-爱生活 · 【ai-rd-tasks：一套评估大语言模型AI研发能力的任务集-20241124171449

昨天

爱可可-爱生活 · //@爱可可-爱生活:AI编程正在推动软件开发从“编码-实现”模-20241123091817

3 天前

黄建同学 · 玩转AI游戏开发！#ai##科技# DeepLearning A-20241121183241

4 天前

宝玉xp · 随着 AI 编程能力提升和 AI 工具的增强，最近掀起了“人人写-20241120131523

6 天前

事考必过 · 公基轻松学 |《文化常识中的古代度量单位》考点清单+重要试题+音频讲解(07.29)

4 月前

文艺研究 · 黄敏︱物体恒常性与现代艺术史的视觉心理机制——以艾伦茨威格为中心

3 月前