专栏名称: 魔搭ModelScope社区
阿里巴巴达摩院模型开源社区ModelScope官方账号
今天看啥  ›  专栏  ›  魔搭ModelScope社区

多图理解,更懂中文,支持function call的Phi-3.5来了!

魔搭ModelScope社区  · 公众号  ·  · 2024-08-21 21:47
    

文章预览

01 引言 微软继今年4月推出Phi-3系列小型语言模型后,又一鼓作气三连发布并开源其「小而美」系列 Phi-3.5模型! 本次发布的三个模型各有特色: Mini型: Phi-3.5-mini-instruct(3.8B) Phi-3.5 mini 具有 38 亿个参数,基于Phi-3 的数据集(合成数据和经过筛选的公开网站)构建,重点关注高质量、推理密集的数据。该模型属于 Phi-3 模型系列,支持 128K 令牌上下文长度。该模型经过了严格的增强过程,结合了监督微调、近端策略优化和直接偏好优化,以确保精确遵守指令和强大的安全措施。Phi-3.5 mini 在 中文场景 有所增强,但是受限于模型的大小,依然会有较多的事实错误,通过 RAG 的方式可以有效降低错误。 MoE型: Phi-3.5-MoE-instruct  (16x3.8B) Phi-3.5-MoE-instruct是一个MoE模型,有 16x3.8B 个参数,使用 2 位专家时有 6.6B 个活动参数。该模型使用词汇量为 32,064 的标记器。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览