专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
文章总数 46  • 
RSS订阅
今天看啥  ›  专栏  ›  青稞AI
青年AI研究员idea加油站,AI开发者的新能源充电桩。
开通 RSS极速订阅 可分钟级获得文章
从字节、百川、Bespoke Labs 3个大模型项目,看RL驱动下的Agent技术趋势
青稞AI  ·  公众号  ·  ·  昨天  ·  访问文章快照
veRL:All in RL元年的必修课
青稞AI  ·  公众号  ·  ·  2 天前  ·  访问文章快照
经验分享!从0开始做一篇Benchmark
青稞AI  ·  公众号  ·  ·  3 天前  ·  访问文章快照
从论文中积累复现 R1 的 insight
青稞AI  ·  公众号  ·  ·  3 天前  ·  访问文章快照
Anthropic:推理模型心口不一,链式思考是否可信?
青稞AI  ·  公众号  ·  ·  4 天前  ·  访问文章快照
Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限
青稞AI  ·  公众号  ·  ·  5 天前  ·  访问文章快照
思考 RLHF 的本质以及主流算法思路
青稞AI  ·  公众号  ·  ·  6 天前  ·  访问文章快照
关于多模态编码位置的简单思考
青稞AI  ·  公众号  ·  ·  1 周前  ·  访问文章快照
RL x LLM 时代:通向 AGI 的四层阶梯
青稞AI  ·  公众号  ·  ·  1 周前  ·  访问文章快照
从Math RL初窥LLM推理模型:是怎么work、哪些trick是有效的!
青稞AI  ·  公众号  ·  ·  1 周前  ·  访问文章快照
刘子纬团队最新成果Free4D:无需微调的 4D 场景生成新框架
青稞AI  ·  公众号  ·  ·  1 周前  ·  访问文章快照
Agentic 是个谎言,本质还是经典RL
青稞AI  ·  公众号  ·  ·  1 周前  ·  访问文章快照
好文推荐!从强化学习到DeepSeek R1
青稞AI  ·  公众号  ·  ·  1 周前  ·  访问文章快照
OpenAI姚顺雨:欢迎来到AI下半场!
青稞AI  ·  公众号  ·  ·  2 周前  ·  访问文章快照
被AI“洗图”也能识别版权!水印技术重大突破:VINE模型全面碾压旧方法!
青稞AI  ·  公众号  ·  ·  2 周前  ·  访问文章快照
重新思考预训练中的反思现象
青稞AI  ·  公众号  ·  ·  2 周前  ·  访问文章快照