今天看啥  ›  专栏  ›  OneFlow

击败GPT4-Turbo,最强开源代码模型DeepSeek-Coder-V2问世

OneFlow  · 公众号  ·  · 2024-06-19 10:01
6月17日,深度求索正式开源了DeepSeek-Coder-V2模型。根据相关评测榜单,这是全球首个在代码、数学能力上超越GPT-4-Turbo、Claude3-Opus、Gemini-1.5Pro等的开源代码大模型。DeepSeek-Coder-V2包含236B与16B两种参数规模,对编程语言的支持从86种扩展到338种。据官方博客介绍,DeepSeek-Coder-V2沿用DeepSeek-V2的MoE模型结构,总参数236B,激活参数21B,在代码、数学的多个榜单上位居全球第二,介于最强闭源模型 GPT-4o和GPT-4-Turbo之间。在拥有世界前列的代码、数学能力的同时,DeepSeek-Coder-V2还具有良好的通用性能,在中英通用能力上位列国内第一梯队。虽然DeepSeek-Coder-V2相比DeepSeek-V2在评测中综合得分更高,但在实际应用中,两个模型各有所长。DeepSeek-V2是精通文本创作、角色扮演等能力的“文科生”,DeepSeek-Coder-V2是精通代码生成、数学计算等能力的“理科生”。一如既往, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照