|
马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI 人工智能与算法学习 · 公众号 · · 3 天前 · 访问文章快照 |
|
刚刚!DeepSeek团队丢出注意力新机制重磅论文 人工智能与算法学习 · 公众号 · · 3 天前 · 访问文章快照 |
|
全新超稀疏架构,推理成本比MoE直降83%! 人工智能与算法学习 · 公众号 · · 1 周前 · 访问文章快照 |
|
4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开 人工智能与算法学习 · 公众号 · · 1 周前 · 访问文章快照 |
|
吴恩达押注Agent新成果官宣! 人工智能与算法学习 · 公众号 · · 1 周前 · 访问文章快照 |
|
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法 人工智能与算法学习 · 公众号 · · 1 周前 · 访问文章快照 |
|
DeepSeek背后的数学:深入解析GRPO 人工智能与算法学习 · 公众号 · · 2 周前 · 访问文章快照 |
|
DeepSeek 发布类似OpenAI o1的推理模型:DeepSeek R1 人工智能与算法学习 · 公众号 · · 1 月前 · 访问文章快照 |