小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law

量子位 · 公众号 · AI · 2024-09-11 12:27

文章预览

西风发自凹非寺量子位 | 公众号 QbitAI 不必增加模型参数，计算资源相同，小模型性能超过比它大 14倍的模型！谷歌DeepMind最新研究引发热议，甚至有人表示这可能就是OpenAI即将发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根据给定的prompt难度，动态地分配测试时（Test-Time）的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说，在预训练阶段花费更少的计算资源，而在推理阶段花费更多，这种策略可能更好。推理时用额外计算来改进输出这项研究的核心问题是—— 在一定计算预算内解决prompt问题，不同的计算策略对于不同问题的有效性有显著差异。我们应如何评估并选择最适合当前问题的测试时计算策略？这种策略与仅仅使用一个更大的预训练模型相比，效果如 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

人工智能那点事 · 包月高达3万元！陪聊、哄睡流行，“情绪消费”还是涉黄服务？

5 天前

金色旋风 · 什么功能都有的超强大AI工具，关键是免费！

5 天前

金色旋风 · 什么功能都有的超强大AI工具，关键是免费！

5 天前

爱可可-爱生活 · [CL]《Stronger Models are NOT Str-20241118055916

5 天前

黄建同学 · 机器人+AI 的这项应用看起来能改变世界！我们正在告别丑陋的建筑-20241117185023

6 天前

人工智能那点事 · “00后”退役女兵开家政公司，网友：“一进门的气势就震撼到我了！”

6 天前

盛和塾 · 视频｜曹岫云：传统文化出口转内销

3 月前

识林 · 【识林新翻译】FDA肿瘤药剂量探索，无菌包装变更，生似药变更，BE数据可靠性，EMA快速警报，APIC审计指南，等

2 月前

经络通全身 · 徐文兵：逼出身体的寒气，这是最好的方法

2 月前

财宝宝 · 今天这个样子，明天的新猪，基本不会来报到了。那么，机构怎么办？肯-20241009151616

1 月前