文章预览
原文:https://zhuanlan.zhihu.com/p/17577753167 在人工智能的世界里,大型语言模型(LLMs)一直是科技巨头们竞相追逐的焦点。然而,微软研究院的最新成果——Phi-4,却以14B参数的“小身材”在众多巨无霸模型中脱颖而出。Phi-4不仅在STEM领域的问答能力上超越了其“老师”GPT-4,还在多个推理任务中表现优异。这一切的背后,是微软团队对数据质量的极致追求和创新性的合成数据生成技术。本文基于Phi-4的技术报告、模型说明及我的一些测试记录进行编写。 技术报告地址: https: / /arxiv.org/abs /2412.08905 Huggingface:https:/ /huggingface.co/microsoft /phi-4O llama: https:/ /ollama.com/library /phi4 1. 引言 近年来,大型语言模型的进步表明,数据质量的提升可以与传统的模型和数据集规模扩展相媲美,甚至超越后者。基于Phi系列模型(如Phi-1、Phi-2和Phi-3)的成功,微软团队推出了Phi
………………………………