最近热门专栏推荐
最近热门专栏推荐
文章总数 400  • 
今天看啥 › 主题  ›  3D
[KV Cache优化]MQA/GQA/YOCO/CLA/MLKV笔记: 层内和层间KV Cache共享 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  昨天  ·  访问文章快照
[张量/序列并行]图解 DeepSpeed-Ulysses & Megatron-LM TP/SP 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  5 天前  ·  访问文章快照
DeepSeek V3/R1 推理效率分析(3):Decode 配置泛化讨论 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  1 周前  ·  访问文章快照
DeepSeek V3/R1 推理效率分析: 满血版逆向工程分解 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  1 周前  ·  访问文章快照
DeepSeek V3/R1 推理效率分析(1):关于DeepSeek V3/R1 Decoding吞吐极限的一些不负责任估计 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  1 周前  ·  访问文章快照
谈谈DeepSeek-R1满血版推理部署和优化 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  2 周前  ·  访问文章快照
详解vLLM和SGLang awq dequantize kernel的魔法 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  2 周前  ·  访问文章快照
非常简洁的图像复原新方法:退化分类预训练,已中ICLR2025 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  2 周前  ·  访问文章快照
《超大规模AI实战手册》PDF领取 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  2 周前  ·  访问文章快照
从DeepSeek MoE专家负载均衡谈起 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  2 周前  ·  访问文章快照
SGLang MLA 实现解析
GiantPandaLLM  ·  公众号  · 3D  ·  3 周前  ·  访问文章快照
免费 | 抢先试用此芯Armv9 AI PC开发套件瑞莎“星睿O6” 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  3 周前  ·  访问文章快照
美团基于SGLang提供INT8无损满血版DeepSeek R1部署方案 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  3 周前  ·  访问文章快照
谈谈DeepSeek原厂推理方案 审核中
GiantPandaLLM  ·  公众号  · 3D  ·  4 周前  ·  访问文章快照