专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

最强开源编程大模型一夜易主:精通80+语言,仅22B

量子位  · 公众号  · AI  · 2024-05-30 12:53
    

文章预览

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 开源代码大模型的王座,再次易主! 来自素有“欧洲OpenAI”之称的Mistral,用22B参数量表现超越了70B的Code Llama。 模型名为Codestral,将代码的英文Code与公司名结合而成。 在80多种编程语言上进行过训练后,Codestral用更少的参数实现了更高的性能,窗口长度也达到了32k,相比之前一众4k、8k的模型大幅增加。 而且已经有人表示,GPT-4o和Claude3-Opus都失败的代码编辑任务,被Codestral成功解决了。 于是有网友直言,Codestral的推出,直接改写了多语言代码模型的游戏规则。 另一方面,还有网友直接@了知名本地大模型框架Ollama,希望能够支持Codestral,结果Ollama这边也迅速响应,在请求发出后1个小时就增加了对Codestral的支持。 那么,Codestral在测试中都取得了哪些成绩呢? 开源编程模型的新王者 Codestral的参数量为22B,支 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览