今天看啥  ›  专栏  ›  斌叔OKmath

你喜欢LLM吗?你也喜欢 for 循环吗?那你一定会喜欢我们的新-20240802225234

斌叔OKmath  · 微博  ·  · 2024-08-02 22:52
    

文章预览

2024-08-02 22:52 本条微博链接 你喜欢LLM吗?你也喜欢 for 循环吗?那你一定会喜欢我们的新论文! 我们通过重复采样来扩展推理计算:我们让模型在解决问题时进行数百或数千次尝试,而不仅仅是一次。通过简单地进行更多采样,我们可以在一系列数学和编码任务中提高 LLM 性能,使较弱的模型(例如 Llama- 3-8B)的表现优于更强大的模型(例如 GPT-4o)的单次尝试。 值得注意的是,通过 DeepSeek-Coder-V2-Instruct 和 250 次尝试,我们 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览