今天看啥  ›  专栏  ›  OneFlow

国产大模型新标杆!比肩GPT4,DeepSeek V2重磅升级

OneFlow  · 公众号  ·  · 2024-07-02 18:10
近日,深度求索团队更新了DeepSeek-V2模型,新版本DeepSeek-V2-Chat模型推理能力有了极大提升。尤其在数学解题、逻辑推理、编程、指令跟随、Json格式输出不同维度上,最高有16%的性能提升。在Arena-Hard测评中,DeepSeek-V2-Chat与GPT-4-0314的对战胜率从41.6%提升到了68.3%。DeepSeek-V2-Chat模型的角色扮演能力显著增强,可以在对话中按要求扮演不同角色。此外,深度求索团队对DeepSeek-V2-Chat的“system”区域指令跟随能力进行了优化,显著增强了沉浸式翻译、RAG 等任务的用户体验。短短半年,深度求索团队的进步堪称神速。今年1月,他们开源了国内首个MoE模型,随后在5月初发布了最强开源MoE模型DeepSeek-V2,6月中旬,他们发布了代码生成能力超越GPT4-Turbo的DeepSeek Coder V2。这一次,DeepSeek-V2-Chat在各方面或比肩GPT4,至少是国产大模型的新标杆。据官方此前介绍,DeepSeek-V ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照