专栏名称: Z Potentials
我们与Z Potentials同频共振
目录
今天看啥  ›  专栏  ›  Z Potentials

速递|DeepSeek联手清华新模型GRM开源,算力降低性能反升

Z Potentials  · 公众号  ·  · 2025-04-08 20:30
    

文章预览

图片来源: DeepSeek DeepSeek  正与清华大学合作,致力于减少其  AI  模型所需的训练量,以降低运营成本, 开发自我进化的  AI  模型。 DeepSeek 曾以一月份推出的低成本推理模型震动市场,现与高校研究人员联合发表论文,详述了一种提升模型效率的强化学习新路径。研究人员写道,这种新方法旨在通过为更准确且易于理解的回答提供奖励,帮助人工智能模型更好地遵循人类偏好。 强化学习在加速特定应用和领域内的   AI  任务方面已被证明有效,但将其扩展到更通用的场景一直充满挑战——这正是  DeepSeek 团队试图通过其所谓的 " 自我原则批判调优 " 来解决的问题。 论文指出,该策略在多项基准测试中超越了现有方法和模型,结果显示能以更少的计算资源实现更优性能。 DeepSeek 公司表示,将这些新模型命名为  DeepSeek-GRM (通用奖励建模的缩写 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览