专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

Deepseek v3 实测来了!智商牛逼,情商不存在,自信退出价格战

夕小瑶科技说  · 公众号  ·  · 2024-12-27 22:26
    

文章预览

事情起因是这样的!下午的 Family 群里,有家人和小鹿说 DeepSeek 的新模型性能不错!但是涨价了! 哦?Deepseek 可是国产大模型界的拼多多啊。这次推出即爆火的 V3 价格翻了一倍不止。 DeepSeek V3 的 API 官方定价: 输入:2 元/M tokens 输出:8 元/M tokens 2025 年 2 月 8 日前, 输入:1 元/M tokens 输出 :2 元/M tokens 不过,这个价格依旧只相当于 Claude 3.5 Sonnet 费用的 1/53(后者每百万输入 3 美元/Mt、输出 15 美元/Mt)。 一起看下 Deepseek-V3 涨价涨的值不值 ~ 模型表现与 Claude 3.5 Sonnet 相当 这次发的新模型 DeepSeek-V3 采用了 671B 参数 MoE 架构,配备约 37B 激活单元,在高达 14.8T 个高质量 Token 上完成了预训练。 DeepSeek-V3 相比上一代 V2 进行了大幅升级,仔细看 数学基准(MATH 500) :取得了 90.2 的高分,领先 Claude 3.5 Sonnet 和 GPT-4o 超过 10 分。 AIME 2024 测试 :领跑,比前 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览