现在的大模型榜单，真就没一个可信的。

数字生命卡兹克 · 公众号 · · 2024-09-10 06:06

文章预览

现在的大模型榜单上，真的都是水分。全是作弊的考生，真的。上周，AI圈有个很炸裂的大模型发布，在全网引起了山呼海啸，一众从业者和媒体尊称它为开源新王。就是 Reflection 70B。在每项基准测试上都超过了 GPT-4o，还只用70B的参数，就击败了405B的Llama 3.1，模型中还有一个叫「Reflection-Tuning」的技术，能让模型能够在最终回复之前，先识别自己有没有错误，如果有，纠正以后再回答。其实这个东西当时我就很存疑，因为在我的理解里，这玩意，就是个CoT，就是个纯Prompt，一个Prompt把70B模型直接带的螺旋升天？你这玩意，真要是能做到，奥特曼就真的直接原地给你磕头了。。。最关键的是，还有一个很离谱的点，这个模型就两个人做，而且，从一拍即合、到找数据集、到模型微调完成并正式发布，一共就花了3周。这效率，这速度，直接卷的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新浪科技 · 【#专家呼吁取消禁酒令#】#对话新十年# “2024中国经济新闻-20241123142620

昨天

新浪科技 · 【#如何用AI对抗麦学# #AI对抗麦学也没什么胜算#】《再见爱-20241123074017

昨天

21ic电子网 · 原作者回击！知名博主“何同学”被曝盗用开源项目

4 天前

西子湖畔 · 复读生的逆袭圣地，惠州这所高中开始招生了！

4 月前

中国电建 · 电建“洋劳模”①丨4567天！“三好员工”乔姆南有话说

3 月前

杭州发布 · 全国首张！12306新功能正式启用，官方教程来了

3 周前