|
大模型Infra这些年,从黑铁时代到黄金时代再到白银时代 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
SOTA多模态大模型架构设计的最佳实践 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
大语言模型工具学习全面综述:背景、定义、范式、评估、趋势 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
从零训练的 1B 以下小模型汇总 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
FP8 低精度训练:Transformer Engine 简析 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
多模态模型(VLM)部署方法抛砖引玉 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
内存墙与LLM 计算 吃果冻不吐果冻皮 · 公众号 · 科技创业 科技自媒体 · 7 月前 · 访问文章快照 |
|
压缩下一个token通向超过人类的智能 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
详解这一年多模态视觉-语言大模型的架构演进 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
图解大模型计算加速系列:分离式推理架构1,从DistServe谈起 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
NVIDIA GPGPU 总览 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
月之暗面kimi底层推理系统方案揭秘 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |