文章预览
3 月 24 日,DeepSeek 无预警发布 DeepSeek-V3-0324 模型,此次更新虽被官方低调地称为“小版本迭代”,但实测表现远超预期。 该模型尤其在代码生成、前端开发等方面显著提升, 甚至部分能力比肩 Claude 3.7 Sonnet,引发全球 AI 社区热议。 在大模型竞技场测试 KCORES 中,DeepSeek-V3-0324 代码能力得分 328.3 分,超越普通版 Claude 3.7 Sonnet(322.3 分),接近 Claude 3.7 Sonnet 的思维链版本(334.8分)。 在 Aider LLM Leaderboard 排行榜中,DeepSeek-V3-0324 在多语言基准测试中得分为 55%,比 V3 有显著提升,比 R1 略低一些。在非思考/推理模型中,它排名第二,仅次于 Claude Sonnet 3.7。 测试数据还表明,在表现良好的模型中,DeepSeek-V3-0324 花费是最低的,比 R1 还低很多,只需大约 1/5,拥有高到令人发指的性价比。 另外,Claude Sonnet 3.7 Thinking 的花费是 DeepSeek-V3-0324 的 33 倍 , o1 是 De
………………………………