|
【ml-engineering 翻译系列】计算加速器之cpu GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
审核中 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
审核中 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】训练之模型并行 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
图解大模型训练系列:序列并行2,DeepSpeed Ulysses GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
【翻译】在FSDP2中开启Float8 All-Gather GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
图解大模型训练系列:序列并行1,Megatron SP GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】AI系统中的网络 benchmark GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
OpenAI o1技术初探3:如何让模型拥有自我纠错的能力 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】AI系统中的网络 debug GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
OpenAI o1 技术初探2:使用MCTS增强推理能力(基于代码实践的解读) GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】AI系统中的网络概述 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
【ml-engineering 翻译系列】大模型推理 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
审核失败 GiantPandaCV · 公众号 · 3D · 2 月前 · 访问文章快照 |
|
课程升级、资源加码!万人共学的书生大模型实战营第4期正式起航! GiantPandaCV · 公众号 · 3D · 2 月前 · 访问文章快照 |
|
OpenAI o1 技术初探1:整体框架,利用Test-Time Scaling Law提升逻辑推理能力 GiantPandaCV · 公众号 · 3D · 2 月前 · 访问文章快照 |
|
【翻译】使用PyTorch FSDP最大化训练吞吐量 GiantPandaCV · 公众号 · 3D · 2 月前 · 访问文章快照 |
|
图文详解 Continuous Batch:不写 CUDA Kernel 也能成倍优化推理效率 GiantPandaCV · 公众号 · 3D · 2 月前 · 访问文章快照 |
|
CUDA-MODE 课程笔记 第14课,Triton 实践指南 GiantPandaCV · 公众号 · 3D · 2 月前 · 访问文章快照 |
|
审核失败 GiantPandaCV · 公众号 · 3D · 2 月前 · 访问文章快照 |