专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

深入了解Deepseek模型的最佳三篇论文

AINLP  · 公众号  ·  · 2025-02-14 22:11
    

主要观点总结



关键观点总结



文章预览

DeepSeek的成功源于其持续的技术创新。过去一年,该公司发布了多篇具有划时代意义的学术论文,确立了技术领先地位。 其中以下几篇尤为重要,因其在技术创新和实际应用中取得了重大突破: DeepSeek-R1:通过强化学习提升大型语言模型的推理能力。 2025年1月发布,提出了一种使用强化学习而非监督学习的方法,显著提升了语言模型在数学和逻辑推理任务中的表现,开辟了新的研究方向。 DeepSeek-V3:高效的混合专家模型。 2024年12月发布,设计了一种高效的混合专家模型,通过激活少量参数实现性能和计算成本的平衡,是大规模模型优化的重要突破。 DeepSeek-LLM:以长期主义扩展开源语言模型。 2024年1月发布,从长期主义视角提出开源语言模型发展策略,推动技术民主化。提出了社区驱动的开源治理框架和多任务优化方法。 一、DeepSeek-R1:通过强 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览