专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

量子位  · 公众号  · AI  · 2025-01-29 11:25
    

文章预览

西风 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~ 就在春晚直播进行时, 阿 里通义Qwen发布新春节礼第三弹 : Qwen2.5-Max 来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。 Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。 基座模型对比中,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B,在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。 更令AI社区关注的是,Qwen2.5-Max同DeepSeek V3一样是 超大规模的MoE模型 ,经超20万亿token的预训练数据及精心设计 SFT+RLHF后训练方案训练而成。 Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek,还有阿里通义Qwen,网友们不忘艾特奥特曼: 祝大家新年快乐, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览