|
图解大模型训练系列:序列并行2,DeepSpeed Ulysses GiantPandaLLM · 公众号 · 3D · 5 月前 · 访问文章快照 |
|
【翻译】在FSDP2中开启Float8 All-Gather GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
图解大模型训练系列:序列并行1,Megatron SP GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】AI系统中的网络 benchmark GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
OpenAI o1技术初探3:如何让模型拥有自我纠错的能力 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】AI系统中的网络 debug GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
OpenAI o1 技术初探2:使用MCTS增强推理能力(基于代码实践的解读) GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】AI系统中的网络概述 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】大模型推理 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
课程升级、资源加码!万人共学的书生大模型实战营第4期正式起航! GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
OpenAI o1 技术初探1:整体框架,利用Test-Time Scaling Law提升逻辑推理能力 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
【翻译】使用PyTorch FSDP最大化训练吞吐量 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
图文详解 Continuous Batch:不写 CUDA Kernel 也能成倍优化推理效率 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
CUDA-MODE 课程笔记 第14课,Triton 实践指南 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
揭秘 PagedAttention(上):如何管理 Paged KV Cache GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
图解KV Cache:加速大模型推理的幕后功臣 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
Flex Attention API 应用 Notebook 代码速览 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |
|
将GLM-4-Plus大模型应用到Cursor中 GiantPandaLLM · 公众号 · 3D · 6 月前 · 访问文章快照 |