今天看啥  ›  专栏  ›  t0mbkeeper

回复@今天韩士奇碰翻东西了吗:目前 R1 的结果和别的模型一样,-20250212183650

t0mbkeeper  · 微博  · 热门自媒体  · 2025-02-12 18:36
    

文章预览

2025-02-12 18:36 本条微博链接 回复 @今天韩士奇碰翻东西了吗 :目前 R1 的结果和别的模型一样,甚至在我告知解决方法的情况下,仍然认为这个问题无解。 评论配图 // @今天韩士奇碰翻东西了吗 :r1 的训练就是用 rl 试图解决这问题。只设定结果,不关心过程,ai 自己去推理,能比较好的摆脱训练数据桎梏,有更好的泛化能力 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览