连接人工智能技术人才和产业人才的交流平台
今天看啥  ›  专栏  ›  机器学习研究组订阅

微软「小而美」系列三连发!视觉小钢炮PK GPT-4o,MoE新秀力压Llama 3.1

机器学习研究组订阅  · 公众号  · AI  · 2024-08-21 17:30

主要观点总结

微软最新推出的Phi 3.5系列模型包括Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct三款新型号,这些模型在第三方基准测试中表现出色,并获得了微软的MIT许可证,可供开发人员在Hugging Face上下载、使用和微调。接下来将介绍这三款模型的特点和用途。

关键观点总结

关键观点1: 微软推出Phi 3.5系列新模型

包括Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct三款新型号,这三个模型都具备优秀的性能并在第三方基准测试中表现突出。

关键观点2: Phi 3.5系列模型的特点和用途

Phi-3.5系列模型具备强大的性能,支持多种语言和长上下文任务。其中,Phi-3.5-mini-instruct是一款轻量级模型,适合在内存或算力受限的设备上使用;Phi-3.5-MoE-instruct是微软Phi模型中的首个MoE模型,擅长处理高质量推理密集数据;Phi_3.5-vision-instruct是一款多模态模型,集成了文本和图像处理功能。

关键观点3: Phi 3.5系列模型的性能表现

Phi 3.5系列模型在某些基准测试中击败了其他领先的大模型,包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1甚至OpenAI的GPT-4o。其中,Phi-3.5系列中的不同型号模型在不同任务上表现出色,如多语言任务、长上下文任务和专业学科任务等。


文章预览

就在今天,微软「小语言模型」系列正式升级,最新的Phi 3.5版本一口气连发三款模型—— - 38.2亿参数的Phi-3.5-mini-instruct - 419亿参数的Phi-3.5-MoE-instruct - 41.5亿参数的Phi-3.5-vision-instruct 这三个模型都可供开发人员在Hugging Face上下载、使用和微调,并获得了微软的MIT许可证,可以进行不受限制的商业应用和修改。 别看规模不大,但这三个模型在很多第三方基准测试中都性能表现都相当不错,甚至在某些情况下击败了其他领先大模型,包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1,甚至在一些竞技场上击败了OpenAI的GPT-4o。 优秀的性能加上宽松的开放许可证,网友在社交网络上纷纷试用并点赞Phi 3.5新系列: 接下来,根据Hugging Face上的发行说明,简要介绍一下三款新型号模型的不同特点和用途。 Phi-3.5-mini-Instruct:小而美 模型:https://huggingface.co/microsoft/Phi-3.5-mini-in ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览