专栏名称: 数字生命卡兹克
反复横跳于不同的AI领域,努力分享一些很酷的AI干货
今天看啥  ›  专栏  ›  数字生命卡兹克

现在的大模型榜单,真就没一个可信的。

数字生命卡兹克  · 公众号  ·  · 2024-09-10 06:06

文章预览

现在的大模型榜单上,真的都是水分。 全是作弊的考生,真的。 上周,AI圈有个很炸裂的大模型发布,在全网引起了山呼海啸,一众从业者和媒体尊称它为开源新王。 就是 Reflection 70B。 在每项基准测试上都超过了 GPT-4o,还只用70B的参数,就击败了405B的Llama 3.1,模型中还有一个叫「Reflection-Tuning」的技术,能让模型能够在最终回复之前,先识别自己有没有错误,如果有,纠正以后再回答。 其实这个东西当时我就很存疑,因为在我的理解里,这玩意,就是个CoT,就是个纯Prompt,一个Prompt把70B模型直接带的螺旋升天? 你这玩意,真要是能做到,奥特曼就真的直接原地给你磕头了。。。 最关键的是,还有一个很离谱的点, 这个模型就两个人做,而且,从一拍即合、到找数据集、到模型微调完成并正式发布,一共就花了3周。 这效率,这速度,直接卷的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览