今天看啥  ›  专栏  ›  课程图谱

转发微博-20250311153131

课程图谱  · 微博  ·  · 2025-03-11 15:31
    

文章预览

2025-03-11 15:31 本条微博链接 转发微博 用极小模型复现R1思维链的失败感悟 网页链接 投完ICML之后火急火燎的入门RL,花了一些时间把RLHF学了。后来在知乎上看到了很多优秀的开源R1复现项目,于是手痒痒啃了下比较火的两个开源项目准备自己实践一下,一个是Huggingface的Open-R1,一个是Logic-RL。由于Logic-RL基于Ver ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览