速递｜DeepSeek联手清华新模型GRM开源，算力降低性能反升

Z Potentials · 公众号 · · 2025-04-08 20:30

文章预览

图片来源： DeepSeek DeepSeek 正与清华大学合作，致力于减少其 AI 模型所需的训练量，以降低运营成本，开发自我进化的 AI 模型。 DeepSeek 曾以一月份推出的低成本推理模型震动市场，现与高校研究人员联合发表论文，详述了一种提升模型效率的强化学习新路径。研究人员写道，这种新方法旨在通过为更准确且易于理解的回答提供奖励，帮助人工智能模型更好地遵循人类偏好。强化学习在加速特定应用和领域内的 AI 任务方面已被证明有效，但将其扩展到更通用的场景一直充满挑战——这正是 DeepSeek 团队试图通过其所谓的 " 自我原则批判调优 " 来解决的问题。论文指出，该策略在多项基准测试中超越了现有方法和模型，结果显示能以更少的计算资源实现更优性能。 DeepSeek 公司表示，将这些新模型命名为 DeepSeek-GRM （通用奖励建模的缩写 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

投行小兵 · 【罗博特科】10亿花的值不值？重组罕见暂缓表决3个月重新上会，收购境外公司是否有重大风险？

昨天

孤狼复盘 · 指数稳得一逼

昨天

孤狼复盘 · 指数稳得一逼

昨天

EarlETF · 数据复盘 4月15日

2 天前

润农畜牧报价 · 2025年4月15日玉米期货主力2507合约降17元，最新2299元中午收盘！

2 天前

美芽 · 8支私藏的千金感香水！住在顶楼的白富美香💗

9 月前

天涯-脚踏阴阳 · 善恶有报终不爽，天道轮回自昭彰。积善之家有余庆，作恶之人祸自尝。-20240820113301

8 月前

Supreme情报网 · 限量20台！「奔驰大G x Nigo」三方联名曝光，确认发售！

5 月前

鱼羊史记 · 1398年，朱元璋驾崩，同一年，浙江诞生了一名男孩，51年后，他竟然为大明王朝续命200年

3 月前

舜网 · 腾讯元宝超越豆包升至中国区苹果免费APP下载排行榜第二

1 月前