|
图解大模型计算加速系列:vLLM源码解析1,整体架构 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
量化方法怎么选?如何评估量化后的大模型LLM? 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
CUDA性能简易优化(一)背景知识 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
第十期-模型压缩与设计书籍赠送活动 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
万字长文详解InfiniBand 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
【LLM应用落地】基于DAMODEL平台部署LLM全套解决方案(以ChatGLM-6B为例) 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
一文详解模型权重存储新格式 Safetensors 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
SGLang:LLM推理引擎发展新方向 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型创业:体感温度与实际温度 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
算法工程师的新机遇:掌握深度学习加速与算法部署技能 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
大模型训练:Megatron-Kwai中的内存优化 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
RAG优化: 非结构化文档解析方案汇总 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · 访问文章快照 |
|
豆瓣9.3,这本书火了29年,被哈佛、剑桥、清华等1500多所大学用作教材! 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型训练方法论及Yi-Large的实践 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · 访问文章快照 |
|
LLama3 405B 技术解读 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · 访问文章快照 |
|
本科生0基础1.5个月拿到LLM高薪岗位近40w学习路径图 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · 访问文章快照 |
|
OpenAI Triton 入门教程 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · 访问文章快照 |
|
图解大模型分离式推理架构2,模糊分离与合并边界的chunked-prefills 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型微调和对齐,这些方法更替太快了! 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · 访问文章快照 |
|
关于RAG优化的几个小技巧 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · 访问文章快照 |