专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
今天看啥  ›  专栏  ›  机器之心

DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型

机器之心  · 公众号  · AI  · 2025-04-03 17:00
    

文章预览

上海交通大学与 SII 联合发布了 DeepResearcher,代码训练框架完全开源。这是 首个在真实网络环境中通过强化学习训练的 AI 研究模型 。 随着大型语言模型(LLMs)推理能力的飞速发展,OpenAI、Google 和 XAI 等科技巨头纷纷推出了备受欢迎的 Deep Research 产品。这些工具能帮助用户整合海量网络信息,解决复杂问题,大大提升研究效率。 但现有系统存在两大痛点:一方面,商业产品如 OpenAI 的 Deep Research 完全是 "黑盒",其技术细节不对外公开;另一方面,开源项目往往依赖人工设计的工作流程,导致行为僵化、泛化能力差,在复杂研究场景中表现脆弱。 DeepResearcher 通过强化学习扩展(RL scaling)在真实网络环境中训练,自发形成了令人惊叹的研究能力。以图中所示的例子为证:在回答问题时,DeepResearcher 不只是简单搜索信息,而是展现出人类才有的复杂行 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览