专栏名称: 包包算法笔记
数据挖掘、机器学习、深度学习、Kaggle竞赛分享与交流。
今天看啥  ›  专栏  ›  包包算法笔记

<200元的o1复现,尽管对比

包包算法笔记  · 公众号  ·  · 2025-01-20 09:30
    

文章预览

我是 小冬瓜AIGC ,原创超长文知识分享 原创课程已帮助多名同学上岸 LLM 赛道 知乎 / 小红书  : 小冬瓜AIGC o1复现猜想很多,但离落地甚远 经过探索, 从理论到实践 ,低成本完成o1类模型复现 ⚠️环境4x4090( < 1days)  低成本 < 200元出效果 Step/PRM训练过程数据 不废话,上效果,  模型开源可测试⚠️ huggingface:  xiaodongguaAIGC/xdg-math-step 测试样例1: 测试样例2: 测试样例3: 【手撕LLM】梳理了o1实现的主流方案,并逐一Notebook实现 部分手撕算法notebook 文档 以上仅摘选第14章节内容 完整课程详情如下 一、课程概况 课程内容:直播 + 往期录播 + 手撕级Notebook + 非调包Code + 算法图解 + 课程PPT 课程项目: o 1模型训练实操🔥 +垂域大模型实操 + DeepSpeed多卡RLHF训练( 实操项目皆可低成本训出效果⚠️ ) 进阶专题 : 手撕o1推理、手撕 RL 、手撕 RLHF 、手撕多模态VLM ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览