开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

大模型智能 · 公众号 · · 2024-12-18 09:00

文章预览

大模型智能｜分享来源 | 量子位作者 | 梦晨 o1完整版公开仅10天，Scaling Law新范式就被逆向工程复现了！ Hugging Face官方发文，开源了扩展测试时计算的方法。用在小小小模型Llama 1B上，数学分数直接超过8倍大的模型，也超过了计算机科学博士生的平均分数（40%）。那么用在Llama 3B上呢？进步幅度更大，甚至能和20几倍大的70B模型媲美。虽然OpenAI o1的配方完全保密，没有发布实现细节或代码，但团队基于DeepMind公布的研究结果，完成了自己的实验。在DeepMind研究的基础上，Hugging Face团队做出如下改进：多样化验证器树搜索（Diverse Verifier Tree Search），一种简单而有效的方法，可以提高多样性和更高性能，特别是在算力预算充足的情况下。开源轻量级工具包 Search and Learn，与推理框架vLLM配合，快速构建搜索策略 01 测试时计算扩展策略目前扩展测 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

十点读书 · 致很累很累的你：人到中年，不想透支自己，千万记得做这3件事

2 天前

十点读书 · 你养的孩子是否心疼你，早有预兆

2 天前

慈怀读书会 · 人生不过如此，不如一笑而过

昨天

蓝钻故事 · 内蒙牧民被这种低级骗术骗了半年，外界竟一无所知？

2 天前

蓝钻故事 · 这才是最低成本富养自己的方式

3 天前

CEO品牌观察 · Birkenstock将在深圳开华南首店、小宠物品牌布卡星获近亿元A轮融资、Alo Yoga在伦敦摄政街开全新旗舰店…｜品牌周报

4 月前

光伏們 · 3.83~4元/瓦（含42%配储、升压站），金惠新能240MW渔光互补EPC中标候选公示

3 月前

聚美丽 · 以科技为刃，绽媄娅以球PDRN革新精准抗老市场

2 周前