豆包代码大模型曝光！在字节最新开源基准里，多种编程语言性能仅次于OpenAI/Claude

量子位 · 公众号 · AI · 2024-12-05 12:22

文章预览

允中发自凹非寺量子位 | 公众号 QbitAI 豆包代码大模型，不小心给曝光了！在字节开源的代码大模型评估基准FullStack Bench里面，出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版，还并没有上线。它在多种编程语言上的性能表现如下，可以看到在闭源模型中排名第五。今年6月，字节还发布了AI编程助手豆包 MarsCode 。据传即由Doubao-Coder模型支撑。目前，豆包MarsCode每月为用户贡献百万量级代码。而回到这个评估基准，据介绍FullStack Bench是目前最全面的代码评估数据集。团队还同步开源了可随时测评代码大模型的沙盒执行环境SandBox Fusion，单服务器即可部署，也可直接在线体验。全新代码大模型评估基准FullStack Bench 既然如此，那就先来了解一下这个最新评估基准。有一说一，现在代码大模型越来越卷，评估AI编程水平的“考卷”也 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · [CV]《Designing Parameter and Com-20250222053929

19 小时前

爱可可-爱生活 · [CL]《RocketKV: Accelerating Long-20250222055726

18 小时前

爱可可-爱生活 · 《爱可可 AI 前沿推介(2.21)》爱可可 AI 前沿推介-20250221222929

昨天

营销之美 · DeepSeek使用图鉴：人类和AI谁在玩弄谁？

昨天

营销之美 · DeepSeek使用图鉴：人类和AI谁在玩弄谁？

昨天

爱可可-爱生活 · 本文提出了高效树搜索算法 ETS，通过线性规划成本模型和语义覆盖-20250221054707

昨天

医学界肿瘤频道 · 肿瘤速练：绝经情况影响乳腺癌患者预后吗?

9 月前

债文新说 · 活跃券成交规律解析

1 周前