|
大模型创业:体感温度与实际温度 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · 访问文章快照 |
|
大模型训练:Megatron-Kwai中的内存优化 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · 访问文章快照 |
|
RAG优化: 非结构化文档解析方案汇总 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · 访问文章快照 |
|
大模型训练方法论及Yi-Large的实践 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · 访问文章快照 |
|
LLama3 405B 技术解读 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · 访问文章快照 |
|
OpenAI Triton 入门教程 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · 访问文章快照 |
|
图解大模型分离式推理架构2,模糊分离与合并边界的chunked-prefills 吃果冻不吐果冻皮 · 公众号 · 前端 科技媒体 · 6 月前 · 访问文章快照 |
|
大模型微调和对齐,这些方法更替太快了! 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · 访问文章快照 |
|
关于RAG优化的几个小技巧 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · 访问文章快照 |
|
【万字长文】10 万卡 H100 集群的尽头…… 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
NVIDIA GPGPU通信架构 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
大模型Infra这些年,从黑铁时代到黄金时代再到白银时代 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
SOTA多模态大模型架构设计的最佳实践 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |
|
大语言模型工具学习全面综述:背景、定义、范式、评估、趋势 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · 访问文章快照 |