专栏名称: GiantPandaCV
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
目录
相关文章推荐
GiantPandaCV  ·  Huggingface ...·  4 天前  
GiantPandaCV  ·  NVIDIA Nemotron-4 ...·  6 天前  
GiantPandaCV  ·  NVIDIA Nemotron-4 ...·  6 天前  
GiantPandaCV  ·  MLIR_对自定义IR ...·  6 天前  
今天看啥  ›  专栏  ›  GiantPandaCV

NVIDIA Nemotron-4 340B 开源技术报告 | 你想要的都在这里

GiantPandaCV  · 公众号  · 3D  · 2024-06-24 22:48
SmartFlowAI点击上方蓝字关注我们本文翻译自英伟达发布的论文《Nemotron-4 340B Technical Report》,由机智流社区成员「北辰」翻译,整篇技术报告将分三期发布全文约 3000 字,预计阅读时间 10 分钟上周,NVIDIA 更新了其最新的开源超大模型 Nemotron-4 340B,这次不仅放出了大模型的参数,也放出了全套预训练、对齐和奖励模型的训练代码,同时还有一份详细的技术报告!在 OpenAI 正在内部讨论要不要“CloseAI”的当下万分难得。现在,就跟着机智流一起来看下这篇诚意满满的技术报告吧。关注机智流,并在后台回复 "340B" ,即可获取论文、模型和代码地址!摘要我们发布了 Nemotron-4 340B 模型系列,包括 Nemotron-4-340B-Base、Nemotron-4-340B-Instruct 和 Nemotron-4-340B-Reward。这些模型根据 NVIDIA 开源模型许可协议(类似 Apache 2.0 协议)向社区进行开源。这些模型在众多的评估基 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照