专栏名称: GiantPandaCV

专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创，每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你，大家一起共同进步(･ω<)☆

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

实战Llama-3-70B RLHF-PPO训练耗时及成本

GiantPandaCV · 公众号 · 3D · 2024-07-17 11:00

文章预览

我是小冬瓜AIGC ，原创超长文知识分享原创课程已帮助多名同学上岸 LLM 赛道知乎 / 小红书：小冬瓜AIGC 按照scaling law，越大的模型性能也越好同时训练的难度也大幅提升以下基于Llama-3- 70B 模型训练，对比SFT/PPO训练耗时运算平台为A800(80G)x8 总体训练耗时 < 2天上述为课程的实操结果可复现，更多课程内容详情如下：一、课程概况课程内容：直播 + 往期录播 + 手撕级Notebook + 非调包源码 + 算法图解 + 课程PPT 课程项目：垂域大模型实操 + DeepSpeed多卡SFT、RM、PPO、DPO训练进阶专题：手撕LLaMA、手撕RL、手撕RLHF PPO(Notebook)、LLM加速、LLM分布式训练入门要求：Pytorch+神经网络或深度学习基础授课形式：每周2章节直播，5周上完前10章节价格：私聊单独咨询实操效果：本课程代码仓库MA-RLHF，实战多卡训练; 已全线支持 Llama-3-8B/70B SFT/DPO/PPO训练； ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博