|
审核中 GiantPandaCV · 公众号 · 3D · 4 天前 · 访问文章快照 |
|
PyTorch 博客 CUTLASS Ping-Pong GEMM Kernel 简介 GiantPandaCV · 公众号 · 3D · 6 天前 · 访问文章快照 |
|
精选25篇NIPS年度Paper,2024 AI研究总结 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
SGLang的Expert Parallel特性解读 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
审核中 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
审核中 GiantPandaCV · 公众号 · 3D · 1 周前 · 访问文章快照 |
|
[分布式训练与TorchTitan] PyTorch中的Async Tensor Parallelism介绍 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
使用torchtune把LLaMa-3.1 8B蒸馏为1B GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
图解Megatron TP中的计算通信overlap GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
将Diffusion模型的推理速度提升了8倍,顺利拿到6家企业offer GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
让预训练 Transformer 生成更长的文本/图像:位置编码长度外推技术 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
审核中 GiantPandaCV · 公众号 · 3D · 2 周前 · 访问文章快照 |
|
CUDA-MODE课程笔记 第17课 GPU集合通信(NCCL) GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |
|
审核中 GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |
|
NIPS 2024 最佳论文 VAR 深度解读:下一尺度预测为何能超越扩散模型? GiantPandaCV · 公众号 · 3D · 3 周前 · 访问文章快照 |
|
审核中 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
审核中 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
图解OpenRLHF中基于Ray的分布式训练流程 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
GTX 4090 的 cuda graph 诡异 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |
|
审核失败 GiantPandaCV · 公众号 · 3D · 1 月前 · 访问文章快照 |