|
LLM预训练与SFT数据配比调研 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
手撕LLM+RLHF+VLM+o1推理,我全都要!!! 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
大模型量化技术原理:FP6 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
现代LLM基本技术整理 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
大模型训练(SFT)实践总结 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
一文搞懂大模型文件存储格式新宠GGUF 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
从芯片公司的角度对LLM推理框架的一些思考 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
对Triton的一些理解 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
Reverse-o1:OpenAI o1原理逆向工程图解 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
算法岗哀鸿遍野,部署工程师却成为香饽饽 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
多模态大模型技术点总结 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
如何从0到1进行预训练工作? 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
大模型低显存推理优化-Offload技术 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
Transformer推理结构简析(Decoder + MHA) 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
【万字长文】模型推理服务工具综述 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |