英伟达70B击败GPT-4o，Ministral 3B击败Llama3.2！

PaperAgent · 公众号 · · 2024-10-17 20:31

文章预览

开源大模型王者又易主了，继续卷！英伟达深夜发布了 Llama-3.1-Nemotron-70B ，其性能优于Anthropic Claude Sonnet 3.5 和 OpenAI GPT-4o，仅次于OpenAI o1。 Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型，旨在提高 LLM 生成的响应对用户查询的帮助性。该模型使用 RLHF（REINFORCE）、在 Llama-3.1-70B-Instruct基础上，通过 Llama-3.1-Nemotron-70B-Reward和HelpSteer2-Preference Prompts训练得到。草莓单词有几个R效果体验demo： https://huggingface.co/chat/models/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF HF模型: https://huggingface.co/collections/nvidia/llama-31-nemotron-70b-670e93cd366feea16abc13d8 在英伟达发力大参数模型的同时， Mistral AI 团队也在端侧小模型方面发力，开源了 Ministral 3B 和 Ministral 8B 。效果上击败了对应尺寸的先进模型： Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 。 Ministral 3B 和 8B 型号与 Gemma 2 2B、Llama 3.2 3B、Lla ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

亿邦动力 · 东方美抢滩新年礼遇市场，毛戈平美妆携浏阳烟花点亮非遗新篇章

15 小时前

JP欧洲跨境服务 · 2025年西班牙欧盟税号申请方法

2 天前

JP欧洲跨境服务 · 2025年西班牙欧盟税号申请方法

2 天前

数据中心运维管理 · 机房精密空调基础知识

3 天前

BlueNote爵士乐俱乐部 · 明晚北京！引领爵士乐新浪潮，惊艳世界的新星 Nubya Garcia 中国首秀！

3 月前

老子道德经 · 人生没有偶然，一切都是注定

1 月前