专栏名称: 白鲸出海
白鲸出海,泛互联网出海服务平台,白鲸专注于具备互联网属性的行业、公司、产品和服务的出海,包括应用、游戏、电商、区块链、智能手机及硬件、旅游、网络文学、影视、动漫、教育、体育和金融等。
今天看啥  ›  专栏  ›  白鲸出海

DeepSeek低调宣称小更新,结果用2折价格达到R1水平

白鲸出海  · 公众号  · 科技公司  · 2025-03-25 22:00
    

文章预览

3 月 24 日,DeepSeek 无预警发布 DeepSeek-V3-0324 模型,此次更新虽被官方低调地称为“小版本迭代”,但实测表现远超预期。 该模型尤其在代码生成、前端开发等方面显著提升, 甚至部分能力比肩 Claude 3.7 Sonnet,引发全球 AI 社区热议。 在大模型竞技场测试 KCORES 中,DeepSeek-V3-0324 代码能力得分 328.3 分,超越普通版 Claude 3.7 Sonnet(322.3 分),接近 Claude 3.7 Sonnet 的思维链版本(334.8分)。 在 Aider LLM Leaderboard 排行榜中,DeepSeek-V3-0324 在多语言基准测试中得分为 55%,比 V3 有显著提升,比 R1 略低一些。在非思考/推理模型中,它排名第二,仅次于 Claude Sonnet 3.7。 测试数据还表明,在表现良好的模型中,DeepSeek-V3-0324 花费是最低的,比 R1 还低很多,只需大约 1/5,拥有高到令人发指的性价比。 另外,Claude Sonnet 3.7 Thinking 的花费是 DeepSeek-V3-0324 的 33 倍 , o1 是 De ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览