2025-01-29 19:53
本条微博链接
【[325星]RAGEN:首个开源复现DeepSeek-R1的强化学习训练框架,助力智能体模型训练。亮点:1. 首次开源复现,填补行业空白;2. 支持多轮统一处理,避免批量大小不稳定;3. 提供世界建模能力,助力智能体规划】 'RAGEN is the first open-source reproduction of DeepSeek-R1 for training agentic models via reinforcement learning.' GitHub: github.com/ZihanWang314/ragen #强化学习# #智能体训练# #开源框架# #AI创造营#
………………………………