|
R1 的一些认知:4 个经典误区 吃果冻不吐果冻皮 · 公众号 · · 9 小时前 · 访问文章快照 |
|
AI Agent 新探索:构建 AI 原生团队,使能 AI 员工 吃果冻不吐果冻皮 · 公众号 · · 昨天 · 访问文章快照 |
|
DeepSeek与智算中心建设运营整体方案的规划设计及实践和产品详解 吃果冻不吐果冻皮 · 公众号 · · 昨天 · 访问文章快照 |
|
重要性采样是什么?在强化学习中怎么应用,又有什么缺陷? 吃果冻不吐果冻皮 · 公众号 · · 2 天前 · 访问文章快照 |
|
一文了解DeepSeek及应用场景 吃果冻不吐果冻皮 · 公众号 · · 5 天前 · 访问文章快照 |
|
详解模型部署工程师的关键技能:CUDA开发与TensorRT部署 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · 访问文章快照 |
|
万字长文总结多模态大模型后训练 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · 访问文章快照 |
|
深度解读大规模深度强化学习的算法优化:Policy Gradient、PPO及PPG 吃果冻不吐果冻皮 · 公众号 · · 2 周前 · 访问文章快照 |
|
“工具赋能”转向“思维共振”?深度解析大语言模型进化浪潮 吃果冻不吐果冻皮 · 公众号 · · 2 周前 · 访问文章快照 |