专栏名称: 科技每日推送
有态度的科技生活媒体,网聚240万+数码达人,专注手机技巧攻略,新品评测试用和互联网爆料,并提供新机报价,手机保修状态、维修回收估价、山寨机鉴别和维修店位置等丰富的查询功能!
今天看啥  ›  专栏  ›  科技每日推送

阿里通义Qwen2成最强开源模型、国内代码大模型安全规范正式定稿、苹果回应AI仅支持两款iPhone

科技每日推送  · 公众号  · 科技媒体  · 2024-06-21 19:24
    

文章预览

每日行业新闻 1、阿里通义Qwen2成斯坦福大模型榜单最强开源模型 斯坦福大学的大模型测评榜单HELM MMLU发布最新结果,斯坦福大学基础模型研究中心主任Percy Liang发文表示,阿里通义千问Qwen2-72B模型成为排名最高的开源大模型,性能超越Llama3-70B模型。 MMLU(Massive Multitask Language Understanding,大规模多任务语言理解)是业界最有影响力的大模型测评基准之一,涵盖了基础数学、计算机科学、法律、历史等57项任务,用以测试大模型的世界知识和问题解决能力。 但在现实测评中,不同参评模型的测评结果有时缺乏一致性、可比性,原因包括使用非标准提示词技术、没有统一采用开源评价框架等等。 根据HELM MMLU最新榜单,阿里巴巴的通义千问开源模型Qwen2-72B排名第5,仅次于Claude 3 Opus、GPT-4o、Gemini 1.5 pro、GPT-4,是排名第一的开源大模型,也是排名最高的中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览