今天看啥  ›  专栏  ›  魔搭ModelScope社区

Compass Arena: 司南x魔搭携手推出大模型竞技场

魔搭ModelScope社区  · 公众号  ·  · 2024-05-17 19:13
    

文章预览

从Llama-3的问世,到参数规模空前的MoE模型,再到GPT-4o的震撼发布,大语言模型(LLM)的飞速进步让人目不暇接。然而,随着模型数量的增加,如何客观、公正地评估和比较这些模型的性能,亟待探索与解决的问题。 或许你曾对 LLM 心生好奇,但却因为缺乏计算资源而无法深入探索?又或者,你对当前的评估方法存有疑虑,感觉它们缺乏客观性和标准化? 为了解决这些问题,上海人工智能实验室 司南 OpenCompass 和 魔搭 ModelScope 推出了大语言模型竞技场  Compass Arena ,旨在为国内的大语言模型领域引入一种全新的竞技模式,为广大互联网用户提供了一个匿名、随机的大语言模型竞技环境,以产生更加客观和真实的评价。 Compass Arena支持众多前沿的商业和社区模型,其中代表性的包括Meta的 Llama-3 系列模型、 阿里巴巴的 Qwen 1.5 系列、 百度的 文心一 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览