今天看啥  ›  专栏  ›  AI寒武纪

太猛了!英伟达让 Deepseek R1 编写 GPU 内核,结果 R1 写的比熟练工程师还好

AI寒武纪  · 公众号  ·  · 2025-02-14 20:45
    

文章预览

  DeepSeek 又上大分! 英伟达使用 DeepSeek-R1 让 AI 自动生成 GPU 内核代码,结果效果超越人类工程师,更离谱的是在 KernelBench Level 1 上实现了 100% 的数值正确性 我们一起来扒一扒事情原委: 随着 AI 模型越来越强大,要解决的问题也越来越复杂。这时候,一种叫做  “推理时序 scaling” (inference-time scaling)  的新技巧就火了起来,听起来高大上,其实说白了,就是给 AI  更多的时间去思考 ! 就像我们人类解难题一样,难题太复杂?那就多花点时间,多想想不同的解法,最终选出最优方案!“推理时序 scaling” 就是让 AI 在推理过程中,分配更多的计算资源,尝试更多可能性,最终找到最佳答案。这也被称为  AI 的“reasoning” 或 “long-thinking” (长思考)  能力 这次 Nvidia 的工程师们就用  DeepSeek-R1  模型,加上  “推理时序 scaling”  技术,搞了个实验, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览