专栏名称: 吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
今天看啥  ›  专栏  ›  吃果冻不吐果冻皮

手撕LLM+RLHF+VLM+o1推理,我全都要!!!

吃果冻不吐果冻皮  · 公众号  ·  · 2024-10-11 09:00

文章预览

我是 小冬瓜AIGC ,原创超长文知识分享 原创课程已帮助多名同学上岸 LLM 赛道 知乎 / 小红书  : 小冬瓜AIGC o1模型展现了惊艳的推理能力 RL+搜索起到了关键的的作用 【手撕LLM】课程更新第14章节 手撕o1推理  部分手撕算法notebook 文档 以上仅摘选第14章节内容 完整课程详情如下 一、课程概况 课程内容:直播 + 往期录播 + 手撕级Notebook + 非调包Code + 算法图解 + 课程PPT 课程项目:垂域大模型实操 + DeepSpeed多卡RLHF训练 进阶专题 : 手撕o1推理、手撕 RL 、手撕 RLHF 、手撕多模态VLM 、LLM加速、LLM分布式训练、手撕RLHF-PPO Notebook 实操效果 :本课程Code仓库, 实战多卡训练,已全线支持Llama-3-8B/70B的 SFT / DPO / PPO 训练; 低成本百元 8B DPO训练 LLM社群 : 学员超过50%来自海外 。部分就业于北美大厂 META、微软、亚麻、苹果、谷歌、TikTok 和eBay等,海外学历背景PhD居 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览