这就翻车了？Reflection 70B遭质疑基模为Llama 3，作者：重新训练

机器之心 · 公众号 · AI · 2024-09-08 12:08

文章预览

机器之心报道编辑：杜伟最近，开源大模型社区再次「热闹」了起来，主角是 AI 写作初创公司 HyperWrite 开发的新模型 Reflection 70B 。它的底层模型建立在 Meta Llama 3.1 70B Instruct 上，并使用原始的 Llama chat 格式，确保了与现有工具和 pipeline 的兼容性。这个模型横扫了 MMLU、MATH、IFEval、GSM8K，在每项基准测试上都超过了 GPT-4o，还击败了 405B 的 Llama 3.1。凭借如此惊艳的效果， Reflection 70B 被冠以开源大模型新王。该模型更是由两位开发者（HyperWrite CEO Matt Shumer 和 Glaive AI 创始人 Sahil Chaudhary）花了 3 周完成，效率可谓惊人。 Reflection 70B 能不能经受住社区的考验呢？今天 AI 模型独立分析机构 Artificial Analysis 进行了独立评估测试，结果有点出乎意料。该机构表示， Reflection Llama 3.1 70B 的 MMLU 得分仅与 Llama 3 70B 相同，并且明显低于 Llama 3.1 70B 。图源：https ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

夕小瑶科技说 · 3名高中生中了AI顶会NeurIPS！来自人大附中、北师大实验中学、上海星河湾双语学校

3 天前

夕小瑶科技说 · 3名高中生中了AI顶会NeurIPS！来自人大附中、北师大实验中学、上海星河湾双语学校

3 天前

黄建同学 · #谷歌聊天机器人竟回复称人类去死吧##ai# 确实有这个回复，一-20241119135326

4 天前

量子位 · 猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

5 天前

宝玉xp · 以后有人说你的 App 是“套壳”，你就这样怼回去：你要这么说 -20241117153243

6 天前

中国人工智能学会 · 聚智促产兴教育才，2024第十三届中国智能产业高峰论坛暨中国人工智能学院院长与名师论坛在杭开幕

1 周前