文章预览
开源大模型王者又易主了,继续卷!英伟达深夜发布了 Llama-3.1-Nemotron-70B ,其性能优于Anthropic Claude Sonnet 3.5 和 OpenAI GPT-4o,仅次于OpenAI o1。 Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的响应对用户查询的帮助性。该模型使用 RLHF(REINFORCE)、 在 Llama-3.1-70B-Instruct基础上,通过 Llama-3.1-Nemotron-70B-Reward和HelpSteer2-Preference Prompts训练得到。 草莓单词有几个R效果 体验demo: https://huggingface.co/chat/models/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF HF模型: https://huggingface.co/collections/nvidia/llama-31-nemotron-70b-670e93cd366feea16abc13d8 在英伟达发力大参数模型的同时, Mistral AI 团队也在 端侧小模型 方面发力,开源了 Ministral 3B 和 Ministral 8B 。效果上击败了对应尺寸的先进模型: Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 。 Ministral 3B 和 8B 型号与 Gemma 2 2B、Llama 3.2 3B、Lla
………………………………