注册登录

专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

目录

相关文章推荐

财联社AI daily · 大厂掀起AI人才争夺战 · 12 小时前

财联社AI daily · 大厂掀起AI人才争夺战 · 12 小时前

AI前线 · 让奥特曼直呼“天才”的o3 和 ... · 23 小时前

机器之心 · 刚刚，OpenAI发布最强推理模型o3！图像 ... · 昨天

AI前线 · 可灵2.0成“最强视觉生成模型”？自称遥遥领 ... · 2 天前

机器之心 · 继VAE之后，Adam也拿到了ICLR ... · 2 天前

今天看啥 › 专栏 › 量子位

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

量子位 · 公众号 · AI · 2024-12-17 12:04

文章预览

梦晨发自凹非寺量子位 | 公众号 QbitAI o1完整版公开仅10天，Scaling Law新范式就被逆向工程复现了！ Hugging Face官方发文，开源了扩展测试时计算的方法。用在小小小模型Llama 1B上，数学分数直接超过8倍大的模型，也超过了计算机科学博士生的平均分数（40%）。那么用在Llama 3B上呢？进步幅度更大，甚至能和20几倍大的70B模型媲美。虽然OpenAI o1的配方完全保密，没有发布实现细节或代码，但团队基于DeepMind公布的研究结果，完成了自己的实验。在DeepMind研究的基础上，Hugging Face团队做出如下改进：多样化验证器树搜索（Diverse Verifier Tree Search），一种简单而有效的方法，可以提高多样性和更高性能，特别是在算力预算充足的情况下。开源轻量级工具包Search and Learn ，与推理框架vLLM配合，快速构建搜索策略测试时计算扩展策略目前扩展测试时 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

财联社AI daily · 大厂掀起AI人才争夺战

12 小时前

财联社AI daily · 大厂掀起AI人才争夺战

12 小时前

AI前线 · 让奥特曼直呼“天才”的o3 和 o4-mini，被曝捏造事实问题严重！拓展强化学习、图像思维链等亮点成陪衬？

23 小时前

机器之心 · 刚刚，OpenAI发布最强推理模型o3！图像深度思考首秀，开源编程智能体已揽5k+star

昨天

AI前线 · 可灵2.0成“最强视觉生成模型”？自称遥遥领先OpenAI、谷歌，技术创新细节大揭秘！

2 天前

机器之心 · 继VAE之后，Adam也拿到了ICLR 时间检验奖，OpenAI联创两次获奖

2 天前

高分子科技 · 大连工业大学王海松教授团队在纤维素基水凝胶传感领域取得系列进展

8 月前

京房会 · 北京楼市：小房或出局，急劝持仓者：

2 月前

华人天下 · 视频|广东一机械制造公司发布《如厕管理规范》

2 月前

红星新闻 · 深夜暴涨！金饰价格已飙升至934元/克，国际金价再创新高

2 周前

教师E家 · 异性之间：发现一个很玄学的现象是，生理上的喜欢，是难以抗拒的。荷尔蒙决定一见钟情，多巴胺决定天长地久！爱上某个人是你的宿命

3 天前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号