注册登录

专栏名称: 人工智能与算法学习

这里是AI领域学习交流的平台！分享人工智能、机器学习、深度学习、计算机视觉、自然语言处理、算法原理、科技前沿、行业动态等，为您提供最有价值的知识和资讯。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

目录

相关文章推荐

格上财富 · 从比尔·盖茨的成长经历，我们需要深刻的反思应试教育 · 2 天前

简七读财 · 四月，万物新生，我们拥有无尽的能量 · 2 天前

格上财富 · 人到中年，睡，相当于救命 · 4 天前

今天看啥 › 专栏 › 人工智能与算法学习

从零训练的 1B 以下小模型汇总

人工智能与算法学习 · 公众号 · · 2024-07-15 18:29

文章预览

作者：Angry Bugs@知乎链接：https://zhuanlan.zhihu.com/p/693252663 最好的学习方式莫过于自己从头做一遍。学习大模型的相关知识以来，一直都想从头自己训练一个 1B 以下的模型，感觉这样才算是真的学过了。不过以手头的资源，也只能玩玩儿迷你的小模型了。最近在网上搜了不少资料，主要是 GitHub 上的仓库和 Arxiv 上的 paper，顺便记录在这里。 https://github.com/karpathy/nanoGPT nanoGPT 是 karpathy 大神写的 GPT-2 最小实现。麻雀虽小，五脏俱全。GPT-2 是大模型的鼻祖，很多论文都以 nanoGPT 为基础魔改或者作为 baseline。nanoGPT 共有 0.1B 到 1.5B 四个大小不同的版本。训练 GPT-2 的文章有很多，虽然有些比较老的，但是也值得参考，列举一些我觉得不错的： https://www.kaggle.com/code/pritishmishra/gpt-training-on-wikipedia-dataset-from-scratch https://zhuanlan.zhihu.com/p/79714797 https://zhuanlan.zhihu.com/p ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

格上财富 · 从比尔·盖茨的成长经历，我们需要深刻的反思应试教育

2 天前

简七读财 · 四月，万物新生，我们拥有无尽的能量

2 天前

格上财富 · 人到中年，睡，相当于救命

4 天前

游戏日报 · 千亿和万亿市场打通？这场出海活动讲出了游戏企业的“更多机会”

8 月前

AutoReport 汽车产经 · 岚图，考上985

6 月前

云南网 · 秋天的第一次身心疗愈，留给云南

6 月前

蝌蚪五线谱 · 这些电动车“御寒神器”很危险，很多人都在用！提醒→

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号