微软「小而美」系列三连发！视觉小钢炮PK GPT-4o，MoE新秀力压Llama 3.1

机器学习研究组订阅 · 公众号 · AI · 2024-08-21 17:30

主要观点总结

微软最新推出的Phi 3.5系列模型包括Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct三款新型号，这些模型在第三方基准测试中表现出色，并获得了微软的MIT许可证，可供开发人员在Hugging Face上下载、使用和微调。接下来将介绍这三款模型的特点和用途。

关键观点总结

关键观点1: 微软推出Phi 3.5系列新模型

包括Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct三款新型号，这三个模型都具备优秀的性能并在第三方基准测试中表现突出。

关键观点2: Phi 3.5系列模型的特点和用途

Phi-3.5系列模型具备强大的性能，支持多种语言和长上下文任务。其中，Phi-3.5-mini-instruct是一款轻量级模型，适合在内存或算力受限的设备上使用；Phi-3.5-MoE-instruct是微软Phi模型中的首个MoE模型，擅长处理高质量推理密集数据；Phi_3.5-vision-instruct是一款多模态模型，集成了文本和图像处理功能。

关键观点3: Phi 3.5系列模型的性能表现

Phi 3.5系列模型在某些基准测试中击败了其他领先的大模型，包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1甚至OpenAI的GPT-4o。其中，Phi-3.5系列中的不同型号模型在不同任务上表现出色，如多语言任务、长上下文任务和专业学科任务等。

文章预览

就在今天，微软「小语言模型」系列正式升级，最新的Phi 3.5版本一口气连发三款模型—— - 38.2亿参数的Phi-3.5-mini-instruct - 419亿参数的Phi-3.5-MoE-instruct - 41.5亿参数的Phi-3.5-vision-instruct 这三个模型都可供开发人员在Hugging Face上下载、使用和微调，并获得了微软的MIT许可证，可以进行不受限制的商业应用和修改。别看规模不大，但这三个模型在很多第三方基准测试中都性能表现都相当不错，甚至在某些情况下击败了其他领先大模型，包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1，甚至在一些竞技场上击败了OpenAI的GPT-4o。优秀的性能加上宽松的开放许可证，网友在社交网络上纷纷试用并点赞Phi 3.5新系列：接下来，根据Hugging Face上的发行说明，简要介绍一下三款新型号模型的不同特点和用途。 Phi-3.5-mini-Instruct：小而美模型：https://huggingface.co/microsoft/Phi-3.5-mini-in ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博