|
对大模型演进方向的思考 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
大模型对齐技术总结:PPO,DPO, SimPO,KTO,Step-DPO, MCTS-DPO,SPO 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
OpenAI o1 的价值意义及 RL 的 Scaling Law 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
无法保证“安全“的大模型还能用吗? 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
基于 chunked prefill 理解 prefill 和 decode 的计算特性 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
大模型二次开发基本思路 吃果冻不吐果冻皮 · 公众号 · 科技自媒体 · 2 月前 · 访问文章快照 |
|
大模型推理服务调度优化技术-Continuous batching 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
入坑大模型18个月的反思与贩私 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
为啥大模型需要量化?如何量化? 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
Meta: System 2 蒸馏 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
ICLR'24 | MiniLLM:大模型的知识蒸馏 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
黑神话悟空火了,为何没人用H100打游戏?(盘点H100和4090的十点区别) 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
GPT5训练失败的思考 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
算法技术设计思考:迭代的思维方式 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
如何估算LLM推理和训练所需的GPU内存? 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |
|
中国算力产业链全景图和重点企业 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · 访问文章快照 |