S1 这个模型用 6 美元成本，大概一千条数据#AI创造营##a-20250206151012

歸藏的AI工具箱 · 微博 · · 2025-02-06 15:10

文章预览

2025-02-06 15:10 本条微博链接 S1 这个模型用 6 美元成本，大概一千条数据 #AI创造营# #ai# #deepseek# 获得了跟 o1-preview 相似的结果而且观测到了跟 O1 和 R1 类似的 scaling 表现可能揭示了 o3-mini-low 和 o3-mini-high 是如何从 O3 蒸馏出来的他们的方式是当 LLM 尝试用 " /think " 停止思考时，他们会强迫它继续思考，将其替换为 "Wait" 。为了缩短或延长思考时间。它会开始质疑和反复核对答案。 o3-mini-low 对比 o3-mini-high 可能也是用了这个 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

人生研究所 · 首饰尽头是珍珠！故宫紫禁文创出品，一眼惊艳！自戴送礼两不误！

昨天

印象笔记 · 3个春日仪式给生活按下暂停键

2 天前

格斗迷 · 徒手打死7只老虎1000多头狼！电视台报道中华奇人是真是假？

4 月前

赵伟宏观探索 · 静待政策验证——9月金融数据点评

4 月前

红古发布 · 央媒看红古|中新网：兰州红古项目建设春潮涌多项目稳步推进

2 周前