专栏名称: 深度学习与NLP
专注深度学习、NLP相关技术、资讯,追求纯粹的技术,享受学习、分享的快乐。
目录
今天看啥  ›  专栏  ›  深度学习与NLP

英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了

深度学习与NLP  · 公众号  ·  · 2024-10-19 00:00
    

文章预览

来源 | 机器之心 今天,英伟达又开源了一个性能超级强大的模型 —— Llama-3.1-Nemotron-70B-Instruct,它击败了 OpenAI 的 GPT-4o 和 Anthropic 的 Claude-3.5 Sonnet 等多个开闭源模型。 从命名来看,显然 Llama-3.1-Nemotron-70B-Instruct 是基于 Llama-3.1-70B 打造而成。 从下图中大模型榜单可以看到, Llama-3.1-Nemotron-70B-Instruct 的性能仅次于 OpenAI 最新 o1 大模型了。 图源:https://x.com/itsPaulAi/status/1846565333240607148 目前,Llama-3.1-Nemotron-70B-Instruct 已经可以在线体验了。Starwberry 中有几个 r 这样的题目难不倒它。 图源:https://x.com/mrsiipa/status/1846551610199273817 不过有时也一本正经地胡说八道,比如「2.11 和 2.9 哪个大」。 体验地址:https://huggingface.co/chat/ 不过英伟达也强调了,他们主要是提高模型在通用领域的性能,尚未针对数学等专业领域的表现进行调优,或许等待一段时间,模型就可 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览