英伟达开源最新大模型Nemotron 70B后，只有OpenAI o1一个对手了

机器之心 · 公众号 · AI · 2024-10-17 17:29

主要观点总结

英伟达开源了大型语言模型Llama-3.1-Nemotron-70B-Instruct，该模型在多个基准测试中表现优异，击败了OpenAI的GPT-4o等模型。模型使用了RLHF技术和Nemotron的训练数据集HelpSteer2。此外，英伟达还开源了另一个模型Llama-3.1-Nemotron-70B-Reward。该模型的性能强大，但部署需要一定的硬件条件和磁盘空间。

关键观点总结

关键观点1: 模型性能优异，击败多个前沿模型

Llama-3.1-Nemotron-70B-Instruct在多个基准测试中排名第一，包括Arena Hard、AlpacaEval 2 LC和GPT-4-Turbo MT-Bench等。击败了OpenAI的GPT-4o和Anthropic的Claude-3.5 sonnet等模型。

关键观点2: 模型使用RLHF技术和HelpSteer2数据集进行训练

Llama-3.1-Nemotron-70B-Instruct使用了RLHF技术（主要是REINFORCE算法）和Nemotron的训练数据集HelpSteer2进行训练，以提高模型在通用领域的性能。

关键观点3: 模型应用广泛，包括聊天、安全、推理等领域

Llama-3.1-Nemotron-70B-Instruct和Llama-3.1-Nemotron-70B-Reward模型在聊天、安全、推理等领域都有出色表现，可以应用于多种场景。

关键观点4: 部署模型需要一定的硬件条件和磁盘空间

想要部署Llama-3.1-Nemotron-70B-Instruct模型需要一台带有4个40GB或2个80GB NVIDIA GPU的机器以及150GB的可用磁盘空间。

文章预览

机器之心报道编辑：杜伟、陈陈英伟达不仅要做显卡领域的领先者，还要在大模型领域逐渐建立起自己的优势。今天，英伟达又开源了一个性能超级强大的模型 —— Llama-3.1-Nemotron-70B-Instruct，它击败了 OpenAI 的 GPT-4o 等闭源模型和 Anthropic 的 Claude-3.5 sonnet 等开源模型。从命名来看，显然 Llama-3.1-Nemotron-70B-Instruct 是基于 Llama-3.1-70B 打造而成。从下图中大模型榜单可以看到， Llama-3.1-Nemotron-70B-Instruct 的性能仅次于 OpenAI 最新 o1 大模型了。图源：https://x.com/itsPaulAi/status/1846565333240607148 目前，Llama-3.1-Nemotron-70B-Instruct 已经可以在线体验了。Starwberry 中有几个 r 这样的题目难不倒它。图源：https://x.com/mrsiipa/status/1846551610199273817 不过有时也一本正经地胡说八道，比如「2.11 和 2.9 哪个大」。体验地址：https://huggingface.co/chat/ 不过英伟达也强调了，他们主要是 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 通俗版解读查看图片-20250212074403

昨天

机器学习研究组订阅 · 4500美元复刻DeepSeek神话，1.5B战胜o1-preview只用RL！训练细节全公开

2 天前

宝玉xp · 回复@wuuyao:提示词中用“用中文重写”相比“翻译成中文”会-20250211225812

2 天前

爱可可-爱生活 · 【Xyne：AI驱动的开源工作搜索与问答引擎，让你的工作信息碎片-20250211214337

2 天前

宝玉xp · “多写点文字记录给未来的养老机器人输入数据”这是个好思路😄👍-20250211011133

2 天前

有道考神建昆老师 · #深夜聊聊# 你是P人还是J人？网页链接 -20240521230000

8 月前

芯世相 · 20240628 Emma有单，您有货吗？

7 月前

宝玉xp · 通常这种老人养老的时候还指望女儿而不是儿子//@程序员邹欣:？/-20240717224731

7 月前

国机工程集团 · 国机工程集团总部（CMEC）与苏伊士国际签署全球战略合作协议

5 月前

梦幻西游 · 梦幻老玩家专属福利来了！15天没登录就有好礼送

1 月前