大猿搬砖简记 - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

我也要提交微信公众号

专栏二维码

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

他们也喜欢这个专栏

文章总数 52 •

今天看啥 › 专栏 › 大猿搬砖简记

学会计出身的码农，和大家一起学习。

最新

开通 RSS极速订阅可分钟级获得文章

提前祝大家蛇年快乐！审核中

大猿搬砖简记 · 公众号 · · 3 周前 · 访问文章快照

收到Deepspeed关于zero3实现差异的回复审核中

大猿搬砖简记 · 公众号 · · 3 周前 · 访问文章快照

探索一个关于deepspeed zero3的认知误区审核中

大猿搬砖简记 · 公众号 · · 3 周前 · 访问文章快照

谈谈对DeepSeek-R1的一些理解审核中

大猿搬砖简记 · 公众号 · · 4 周前 · 访问文章快照

再读MLA，还有多少细节是你不知道的

大猿搬砖简记 · 公众号 · · 4 周前 · 访问文章快照

图解Megatron TP中的计算通信overlap 审核中

大猿搬砖简记 · 公众号 · · 1 月前 · 访问文章快照

图解OpenRLHF中基于Ray的分布式训练流程

大猿搬砖简记 · 公众号 · · 2 月前 · 访问文章快照

人人都能看懂的RL-PPO理论知识

大猿搬砖简记 · 公众号 · · 3 月前 · 访问文章快照

图解大模型训练系列：序列并行4，Megatron Context Parallel

大猿搬砖简记 · 公众号 · · 3 月前 · 访问文章快照

图解大模型训练系列：序列并行3，Ring Attention

大猿搬砖简记 · 公众号 · · 3 月前 · 访问文章快照

图解大模型训练系列：序列并行2，DeepSpeed Ulysses

大猿搬砖简记 · 公众号 · · 3 月前 · 访问文章快照

图解大模型训练系列：序列并行1，Megatron SP

大猿搬砖简记 · 公众号 · · 3 月前 · 访问文章快照

如何用一个统一的视角，分析RLHF下的各种算法？

大猿搬砖简记 · 公众号 · · 4 月前 · 访问文章快照

避开复数推导，我们还可以怎么理解RoPE（重制版）

大猿搬砖简记 · 公众号 · · 4 月前 · 访问文章快照

OpenAI o1技术初探3：如何让模型拥有自我纠错的能力

大猿搬砖简记 · 公众号 · · 4 月前 · 访问文章快照

OpenAI o1 技术初探2：使用MCTS增强推理能力（基于代码实践的解读）

大猿搬砖简记 · 公众号 · · 4 月前 · 访问文章快照

新增o1训练框架图例

大猿搬砖简记 · 公众号 · · 4 月前 · 访问文章快照

OpenAI o1 技术初探1：整体框架，利用Test-Time Scaling Law提升逻辑推理能力

大猿搬砖简记 · 公众号 · · 4 月前 · 访问文章快照

避开复数推导，我们还可以怎么理解RoPE？

大猿搬砖简记 · 公众号 · · 5 月前 · 访问文章快照

分享一些高效阅读论文和代码的方法

大猿搬砖简记 · 公众号 · 科技自媒体学习 · 5 月前 · 访问文章快照

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号