今天看啥  ›  专栏  ›  虎嗅APP

“DeepSeek接班OpenAI”,R1推理模型让AI圈爆了

虎嗅APP  · 公众号  · 科技媒体  · 2025-01-21 17:47
    

文章预览

本文来自微信公众号: 机器之心 ,原文标题:《“DeepSeek接班OpenAI”,最新开源的R1推理模型,让AI圈爆了》,头图来自:《硅谷》 昨晚,大模型领域再次“热闹起来”,月之暗面发布在数学、代码、多模态推理能力层面全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5。而最近大热的 DeepSeek 正式推出了 DeepSeek-R1,同样在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。 去年 12 月开源的大模型 DeepSeek-V3 刚刚掀起了一阵热潮,实现了诸多的不可能。这次开源的 R1 大模型则在一开始就让一众 AI 研究者感到“震惊”,人们纷纷在猜测这是如何做到的。 AutoAWQ 作者 Casper Hansen 表示, DeepSeek-R1 使用一种多阶段循环的训练方式:基础→ RL →微调→ RL →微调→ RL。 UC Berkeley 教授 Alex Dimakis 则认为 DeepSeek 现在已经处于领先位置,美国公司可能需要迎 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览