专栏名称: GiantPandaCV

专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创，每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你，大家一起共同进步(･ω<)☆

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

NVIDIA Nemotron-4 340B 开源技术报告（二） | 你想要的都在这里

GiantPandaCV · 公众号 · 3D · 2024-06-24 22:48

文章预览

SmartFlowAI 点击上方蓝字关注我们本文翻译自英伟达发布的论文《Nemotron-4 340B Technical Report》，由机智流社区成员「北辰」翻译，整篇技术报告将分三期发布，本期为第二期全文约 4800 字，预计阅读时间 13 分钟上周，NVIDIA 更新了其最新的开源超大模型 Nemotron-4 340B ，这次不仅放出了大模型的参数，也放出了全套预训练、对齐和奖励模型的训练代码，同时还有一份详细的技术报告！在 OpenAI 正在内部讨论要不要“CloseAI”的当下万分难得。现在，就跟着机智流一起来看下这篇诚意满满的技术报告吧。关注机智流，并在后台回复 "340B" ，即可获取论文、模型和代码地址! 3 对齐 3.1 奖励模型奖励模型在模型对齐中起着关键作用，作为训练强指令跟随模型中的偏好排名和质量过滤的重要评判标准。为了开发一个强大的奖励模型，我们收集了一个包含 10k ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博