|
Qwen2.5-Math 技术报告详解 吃果冻不吐果冻皮 · 公众号 · · 4 周前 · 访问文章快照 |
|
系统梳理LLM+RLHF发展脉络 吃果冻不吐果冻皮 · 公众号 · · 4 周前 · 访问文章快照 |
|
LLM实践--支线:拯救Continue Pretrain的数据 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
关于大模型评测的 Yi 点思考 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
TensorRT-LLM保姆级教程(三)-使用Triton推理服务框架部署模型 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
OpenAI o1 self-play RL 技术路线推演 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
LLM数据合成之后训练篇 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |
|
专补大模型短板的RAG入门与实战书来了! 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · 访问文章快照 |