专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

豆包代码大模型曝光!在字节最新开源基准里,多种编程语言性能仅次于OpenAI/Claude

量子位  · 公众号  · AI  · 2024-12-05 12:22
    

文章预览

允中 发自 凹非寺 量子位 | 公众号 QbitAI 豆包代码大模型,不小心给曝光了! 在字节开源的代码大模型评估基准FullStack Bench里面,出现了此前字节未披露过的Doubao-Coder。 不过目前还只是Preview版,还并没有上线。 它在多种编程语言上的性能表现如下,可以看到在闭源模型中排名第五。 今年6月,字节还发布了AI编程助手豆包 MarsCode 。据传即由Doubao-Coder模型支撑。 目前,豆包MarsCode每月为用户贡献百万量级代码。 而回到这个评估基准,据介绍FullStack Bench是目前最全面的代码评估数据集。 团队还同步开源了可随时测评代码大模型的沙盒执行环境SandBox Fusion, 单服务器即可部署,也可直接在线体验 。 全新代码大模型评估基准FullStack Bench 既然如此,那就先来了解一下这个最新评估基准。 有一说一,现在代码大模型越来越卷,评估AI编程水平的“考卷”也 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览