|
继续预训练 LLM ---数据筛选的思路 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
[LLM推理优化][万字]TensorRT-LLM部署调优-指北 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
LLM PTQ 量化经典研究解析 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
大模型之不同精度下显存占用与相互转换实践 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
为什么有的导师可以做到「既不push,学生还能连发顶会」? 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
大模型训练工程优化技术-总纲 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
从零实现一个MOE(专家混合模型) 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
借着triton inference server聊一下各种batching方法 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
增强大语言模型 Agents 的工作记忆能力 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
LLM数据标注技术调研:定义、框架、提示、反馈、评价、挑战、机遇 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
超大模型加载转换Trick 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
浅谈RAG的十大挑战 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
Pytorch 显存管理机制与显存占用分析方法 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
LoRA不香了,小小Llama-3全参训练,拿下!! 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
量化那些事之FP8与LLM-FP4 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
大模型推理优化技术-KV Cache 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
LLM生成解码策略原理及其代码实现 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |
|
序列并行做大模型训练,你需要知道的六件事 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · 访问文章快照 |