文章预览
来源 | 新智元 ID | AI-era 难倒一大片LLM经典难题,竟被突如其来的70B新模型破解? 而且是,一次就能做对那种。 别不信,就拿9.11和9.9谁大难题小试一下,模型不用思索便给出了正确答案。 即便是嘴漏误答之后,借助「反思」魔法,能够自动纠正。 如上所示,它可以反思,然后再自主改正。故名,Reflection 70B。 Reflection,一出世便被冠以「世界顶级开源」模型之称,性能强到令人发指。 在各项基准测试中,横扫MMLU、MATH、IFEval、GSM8K,甚至击败了GPT-4o,以及Llama 3.1超大杯。 背后这家AI写作初创HyperWrite鲜有人知,但不得不称赞的是,这一模型竟是由两个人肝了几周速成。 一个是创始人兼CEO Matt Shumer,另一位是联创Sahil Chaudhary。 Shumer介绍,未来还将上线405B模型,有望成为超越世界最顶尖闭源模型。 一上线流量暴增,GPU不够用了 AI圈里,许久未见如此
………………………………