|
【万字长文】模型推理服务工具综述 吃果冻不吐果冻皮 · 公众号 · · 14 小时前 · 访问文章快照 |
|
审核中 吃果冻不吐果冻皮 · 公众号 · · 昨天 · |
|
大模型对齐技术总结:PPO,DPO, SimPO,KTO,Step-DPO, MCTS-DPO,SPO 吃果冻不吐果冻皮 · 公众号 · · 2 天前 · 访问文章快照 |
|
审核失败 吃果冻不吐果冻皮 · 公众号 · · 3 天前 · |
|
OpenAI o1 的价值意义及 RL 的 Scaling Law 吃果冻不吐果冻皮 · 公众号 · · 4 天前 · 访问文章快照 |
|
无法保证“安全“的大模型还能用吗? 吃果冻不吐果冻皮 · 公众号 · · 5 天前 · 访问文章快照 |
|
基于 chunked prefill 理解 prefill 和 decode 的计算特性 吃果冻不吐果冻皮 · 公众号 · · 5 天前 · 访问文章快照 |
|
大模型二次开发基本思路 吃果冻不吐果冻皮 · 公众号 · · 6 天前 · 访问文章快照 |
|
大模型推理服务调度优化技术-Continuous batching 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · 访问文章快照 |
|
审核中 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
审核中 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
审核中 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
ICLR'24 | MiniLLM:大模型的知识蒸馏 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · 访问文章快照 |
|
黑神话悟空火了,为何没人用H100打游戏?(盘点H100和4090的十点区别) 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · 访问文章快照 |
|
审核中 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
审核中 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
审核中 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
审核中 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
如何估算LLM推理和训练所需的GPU内存? 吃果冻不吐果冻皮 · 公众号 · · 2 周前 · 访问文章快照 |