专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

发现了 DeepSeek-R1 和所有推理模型的一个非常有趣的事-20250201103028

斌叔OKmath  · 微博  ·  · 2025-02-01 10:30
    

文章预览

2025-02-01 10:30 本条微博链接 发现了 DeepSeek-R1 和所有推理模型的一个非常有趣的事情:错误答案要长得多,而正确答案要短得多。即使是同一个问题,当我们重新运行模型时,它有时会产生一个简短(通常是正确的)答案或一个错误的冗长答案。基于此,我想提出一个简单的想法,称为 Laconic 解码:运行模型 5 次(并行),并选择具有最少标记数的答案。我们的初步结果表明,这种解码在 AIME24 上仅需几次并行运行就能产 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览