现代LLM基本技术整理

深度学习基础与进阶 · 公众号 · · 2024-10-11 19:10

文章预览

作者：hadiii 链接：https://zhuanlan.zhihu.com/p/720106482 0 开始之前本文从Llama 3报告出发，基本整理一些现代LLM的技术。'基本'，是说对一些具体细节不会过于详尽，而是希望得到一篇相对全面，包括预训练，后训练，推理，又能介绍清楚一些具体技术，例如RM，DPO，KV Cache，GQA，PagedAttention，Data Parallelism等等的索引向文章。由于东西比较多，且无法详尽细节，所以推荐大家二次整理为自己的笔记。本文的主要参考是Llama Team的The Llama 3 Herd of Models报告原文，以及沐神回归B站新出的论文精读系列。同时也包括一些知乎的优秀文章。 1 Intro Illustration of the overall architecture and training of Llama 3 Overview of the Llama 3 Herd of models. 1.1 现代基础模型训练的主要阶段（a）预训练阶段（pre-training stage）：算法相对直接，一般是用大量的数据去做下一个词的预测（next-word predictio ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

胡锡进 · 退役体操运动员吴柳芳上周发比较性感的视频，粉丝暴涨，但同时招来“-20241128213853

11 小时前

新华社 · 好消息！“花花”24小时营业

3 天前

胡锡进 · 看了几个事情，泛议几句。互联网很严厉，有很高的道德标准，这非常可-20241125211202

3 天前

澎湃新闻 · 前体操冠军吴柳芳当网红惹“擦边”争议，鞠躬致歉

4 天前

胡锡进 · 很久没说股市了，其实老胡一直没有离开，并且跟着大家起起伏伏，喜怒-20241122181119

6 天前

国企求职 · 2025届秋招全面开启！网申信息汇总表已更新！

3 月前