开源界的黑马！2人团队干翻GPT-4o，70B纠错技术引领新潮流

深度学习与NLP · 公众号 · · 2024-09-08 00:00

文章预览

来源 | 新智元 ID | AI-era 难倒一大片LLM经典难题，竟被突如其来的70B新模型破解？而且是，一次就能做对那种。别不信，就拿9.11和9.9谁大难题小试一下，模型不用思索便给出了正确答案。即便是嘴漏误答之后，借助「反思」魔法，能够自动纠正。如上所示，它可以反思，然后再自主改正。故名，Reflection 70B。 Reflection，一出世便被冠以「世界顶级开源」模型之称，性能强到令人发指。在各项基准测试中，横扫MMLU、MATH、IFEval、GSM8K，甚至击败了GPT-4o，以及Llama 3.1超大杯。背后这家AI写作初创HyperWrite鲜有人知，但不得不称赞的是，这一模型竟是由两个人肝了几周速成。一个是创始人兼CEO Matt Shumer，另一位是联创Sahil Chaudhary。 Shumer介绍，未来还将上线405B模型，有望成为超越世界最顶尖闭源模型。一上线流量暴增，GPU不够用了 AI圈里，许久未见如此 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博