专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

最强开源CodeLLM模型深夜来袭!320亿参数,Qwen2.5-Coder新模型超越GPT-4o

量子位  · 公众号  · AI  · 2024-11-12 12:12
    

主要观点总结

本文介绍了Qwen2.5-Coder的发布及其超越GPT-4o的性能表现。包括其开源的编程模型,多语言支持,以及基于该模型构建的智能代码助手等应用。文章还提到了Qwen系列模型的发展历程和全球影响力。

关键观点总结

关键观点1: Qwen2.5-Coder系列模型发布

Qwen2.5-Coder系列模型包括多个尺寸的模型,最新发布的是旗舰版Qwen2.5-Coder-32B-Instruct,它在编程模型的五个关键方面实现了对GPT-4o的超越。

关键观点2: 超越GPT-4o的性能

Qwen2.5-Coder-32B在多个流行的代码生成、代码修复、代码推理基准上取得了开源SOTA,甚至超越了闭源的GPT-4o和Sonnet。

关键观点3: 多语言支持

Qwen2.5-Coder支持92种编程语言,并在多种语言上表现出色,如在Haskell、Racket等语言上取得超高分数。

关键观点4: 智能代码助手应用

基于Qwen2.5-Coder打造的智能代码助手,可以辅助开发者快速开发小应用或游戏,如自动制作2048小游戏,生成英语单词卡页面等。

关键观点5: 全球影响力和开源价值

Qwen系列模型作为全球最受欢迎的开源编程大模型之一,代表了开源模型的最高水平。其推出体现了开源模型和闭源模型之间的差距正在缩短,为全球开发者提供了更低门槛、开放的AI能力。


文章预览

小明 发自 凹非寺 量子位 | 公众号 QbitAI 一夜之间,AI编程模型的开源王座易主了! Qwen2.5-Coder-32B正式发布, 霸气拿下多个主流基准测试SOTA ,彻底登上全球最强开源编程模型宝座。 更重要的是,在代码能力的12个主流基准上,Qwen2.5-Coder-32B与GPT-4o对决, 斩获9胜 ,一举掀翻闭源编程模型的绝对统治。 不用一行代码,只要输入最直接、够详细的自然语言prompt,它就能给你整全套: 比如,做个简单的模拟三体运动的HTML网页吧! 生成个game of life的小游戏,也是手拿把掐: 哪怕是完全不懂编程的小白,也能轻松上手。比如我们体验了一把用一句大白话生成计算器: 很快就搞定了,计算器可以直接使用。 还有更多好玩又实用的应用,比如不到20秒生成一个音乐播放器。 做简历也易如反掌: 怪不得开发者们都说,太恐怖了, 超越了4o,与Sonnet、o1都能掰手 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览