注册登录

专栏名称: 斌叔OKmath

橙旭园CEO 教育博主教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

贵州省应急管理厅 · 春分至，踏青正当时！这份安全指南伴你畅游春天！ · 昨天

贵州省应急管理厅 · 春分至，踏青正当时！这份安全指南伴你畅游春天！ · 昨天

清晨朗读会 · 清晨朗读3217：7 Keys to ... · 3 天前

清晨朗读会 · 渊源直播 · 3 天前

今天看啥 › 专栏 › 斌叔OKmath

发现了 DeepSeek-R1 和所有推理模型的一个非常有趣的事-20250201103028

斌叔OKmath · 微博 · · 2025-02-01 10:30

文章预览

2025-02-01 10:30 本条微博链接发现了 DeepSeek-R1 和所有推理模型的一个非常有趣的事情：错误答案要长得多，而正确答案要短得多。即使是同一个问题，当我们重新运行模型时，它有时会产生一个简短（通常是正确的）答案或一个错误的冗长答案。基于此，我想提出一个简单的想法，称为 Laconic 解码：运行模型 5 次（并行），并选择具有最少标记数的答案。我们的初步结果表明，这种解码在 AIME24 上仅需几次并行运行就能产 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

贵州省应急管理厅 · 春分至，踏青正当时！这份安全指南伴你畅游春天！

昨天

贵州省应急管理厅 · 春分至，踏青正当时！这份安全指南伴你畅游春天！

昨天

清晨朗读会 · 清晨朗读3217：7 Keys to Effective Mental Training (2)

3 天前

清晨朗读会 · 渊源直播

3 天前

艾橙互动 · EPIC《龙腾世纪：审判》限免，年度最佳，收

10 月前

中农农业研究院 · 农业农村部办公厅关于开展2024年农业品牌精品培育工作的通知

9 月前

互联网er的早读课 · 学生数量断崖式下降，学校大规模关停

8 月前

一枚游戏干饭人 · 【游戏杂谈】从“崩坏”IP 生态圈的塑造讨论米哈游的IP运营能力

7 月前

机器学习研究组订阅 · DeepMind最新成果剑指量子力学，FermiNet或将破解近百年计算难题

6 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号