|
DeepSeek-R1的强化学习算法:群组相对策略优化(GRPO) 架构师带你玩转AI · 公众号 · · 2 天前 · 访问文章快照 |
|
第十五天:卷积神经网络CNN - 卷积和池化 架构师带你玩转AI · 公众号 · · 2 天前 · 访问文章快照 |
|
DeepSeek-R1 + RAG搭建本地知识库 架构师带你玩转AI · 公众号 · 科技创业 科技自媒体 · 4 天前 · 访问文章快照 |
|
DeepSeek-R1深度推理的核心技术:思维链(CoT) 架构师带你玩转AI · 公众号 · · 1 周前 · 访问文章快照 |
|
一文搞懂DeepSeek - 多头注意力(MHA)和多头潜在注意力(MLA) 架构师带你玩转AI · 公众号 · · 2 周前 · 访问文章快照 |
|
第十二天:防止模型过拟合 - 正则化 架构师带你玩转AI · 公众号 · · 2 周前 · 访问文章快照 |
|
一文搞懂DeepSeek - 强化学习和蒸馏 架构师带你玩转AI · 公众号 · · 2 周前 · 访问文章快照 |