专栏名称: CTO肉饼
robbin是前JavaEye网站创始人,现在是丁香园CTO。如果你是技术人员,正在创业或者希望加入创业,关注互联网产品、研发、运营、创业管理,请关注我。
今天看啥  ›  专栏  ›  CTO肉饼

通义千问2.0 - 中国开源大模型终于支棱起来了

CTO肉饼  · 公众号  · 程序员  · 2024-06-08 10:54
    

文章预览

中美两国在人工智能领域的竞争进入白热化阶段了。美国不仅仅全面禁止了英伟达GPU对中国的出口,甚至考虑禁止让中国人下载和使用开源的AI大模型Llama 3,不光不让你训练AI,连现成的都不想给你用。要知道Llama 3可是全球最流行的开源AI大模型,就如同智能手机中的Android操作系统一样。 那你说,我们就没招了吗?当然不是!阿里云最新开源的AI大模型通义千问2.0已经全面赶上甚至超过了Llama 3。 我们来看看同样是主力720亿参数的AI:千问-72B vs Llama 3-72B: 千问-72B已经在各项AI模型的测评中全面碾压了Llama 3-72B。在经过指令微调之后,千问-72B仍然在绝大多数任务中全面超越了Llama 3。毫无疑问,对我们来说,千问已经完全可以替代Llama 3了。 当然,这种720亿参数的AI大模型主要用来秀肌肉的。我们平常在企业中私有化部署和使用,往往使用100亿参数以 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览