专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

（徒手搓LLM）逐行代码从0构造一个LLM——LlaMa篇

深度学习自然语言处理 · 公众号 · · 2024-10-24 20:33

文章预览

知乎：mc112611（已授权）链接：https://zhuanlan.zhihu.com/p/1674261485 本篇为：面向人群：觉得LLM很多复杂的结构和层级，懂很多原理，但是不知道怎么结合到一起本篇会很长，但是应该不会又臭又长本篇可能像当头一棒，但是有可能：力度刚刚好，懵逼不伤脑。逐行拆解LlaMa大模型的所有算子，架构，包括RMSNorm，ROPE，SwiGLU实现本篇未采用huggingface的库，全程pytorch实现，没有任何预训练模型起始点为一本《西游记》原文，终点为你自己练的大模型准备好pytorch，即使没有显卡也没关系，主要是LLM原理的学习，而不是看完这个文章就可以造个新的大模型架构出来。本篇会竭尽所能，全程用大白话去拆分原理。引言本文全部代码已分享至google_colab，有魔法的可以自行查看，代码逐行注释，不想看文章的，可直接去colab上跑一下，不需要GPU资源，直接最低 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博