专栏名称: 科技每日推送

有态度的科技生活媒体，网聚240万+数码达人，专注手机技巧攻略，新品评测试用和互联网爆料，并提供新机报价，手机保修状态、维修回收估价、山寨机鉴别和维修店位置等丰富的查询功能！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

阿里通义Qwen2成最强开源模型、国内代码大模型安全规范正式定稿、苹果回应AI仅支持两款iPhone

科技每日推送 · 公众号 · 科技媒体 · 2024-06-21 19:24

文章预览

每日行业新闻 1、阿里通义Qwen2成斯坦福大模型榜单最强开源模型斯坦福大学的大模型测评榜单HELM MMLU发布最新结果，斯坦福大学基础模型研究中心主任Percy Liang发文表示，阿里通义千问Qwen2-72B模型成为排名最高的开源大模型，性能超越Llama3-70B模型。 MMLU（Massive Multitask Language Understanding，大规模多任务语言理解）是业界最有影响力的大模型测评基准之一，涵盖了基础数学、计算机科学、法律、历史等57项任务，用以测试大模型的世界知识和问题解决能力。但在现实测评中，不同参评模型的测评结果有时缺乏一致性、可比性，原因包括使用非标准提示词技术、没有统一采用开源评价框架等等。根据HELM MMLU最新榜单，阿里巴巴的通义千问开源模型Qwen2-72B排名第5，仅次于Claude 3 Opus、GPT-4o、Gemini 1.5 pro、GPT-4，是排名第一的开源大模型，也是排名最高的中 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博