今天看啥  ›  专栏  ›  吃果冻不吐果冻皮

微软 Phi-4:小模型的大智慧——技术详解及简单测评

吃果冻不吐果冻皮  · 公众号  ·  · 2025-01-12 12:00
    

文章预览

原文:https://zhuanlan.zhihu.com/p/17577753167 在人工智能的世界里,大型语言模型(LLMs)一直是科技巨头们竞相追逐的焦点。然而,微软研究院的最新成果——Phi-4,却以14B参数的“小身材”在众多巨无霸模型中脱颖而出。Phi-4不仅在STEM领域的问答能力上超越了其“老师”GPT-4,还在多个推理任务中表现优异。这一切的背后,是微软团队对数据质量的极致追求和创新性的合成数据生成技术。本文基于Phi-4的技术报告、模型说明及我的一些测试记录进行编写。 技术报告地址: https: / /arxiv.org/abs /2412.08905 Huggingface:https:/ /huggingface.co/microsoft /phi-4O llama: https:/ /ollama.com/library /phi4 1. 引言 近年来,大型语言模型的进步表明,数据质量的提升可以与传统的模型和数据集规模扩展相媲美,甚至超越后者。基于Phi系列模型(如Phi-1、Phi-2和Phi-3)的成功,微软团队推出了Phi ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览