专栏名称: 吃果冻不吐果冻皮

专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

环保人 · 废水中甲醇的排放限值取多少合适？有明确依据不？ · 7 小时前

环保人 · 初期雨水池和事故应急池可以共用？请看23年新 ... · 昨天

姑苏晚报 · 解除预警！ · 2 天前

环评观察 · 《天津市固定污染源自动监控管理办法（修订）》印发 · 2 天前

环评互联网 · 关于优化制药建设项目环评工作的通知（征求意见稿） · 3 天前

今天看啥 › 专栏 › 吃果冻不吐果冻皮

微软 Phi-4：小模型的大智慧——技术详解及简单测评

吃果冻不吐果冻皮 · 公众号 · · 2025-01-12 12:00

文章预览

原文：https://zhuanlan.zhihu.com/p/17577753167 在人工智能的世界里，大型语言模型（LLMs）一直是科技巨头们竞相追逐的焦点。然而，微软研究院的最新成果——Phi-4，却以14B参数的“小身材”在众多巨无霸模型中脱颖而出。Phi-4不仅在STEM领域的问答能力上超越了其“老师”GPT-4，还在多个推理任务中表现优异。这一切的背后，是微软团队对数据质量的极致追求和创新性的合成数据生成技术。本文基于Phi-4的技术报告、模型说明及我的一些测试记录进行编写。技术报告地址： https: / /arxiv.org/abs /2412.08905 Huggingface：https:/ /huggingface.co/microsoft /phi-4O llama: https:/ /ollama.com/library /phi4 1. 引言近年来，大型语言模型的进步表明，数据质量的提升可以与传统的模型和数据集规模扩展相媲美，甚至超越后者。基于Phi系列模型（如Phi-1、Phi-2和Phi-3）的成功，微软团队推出了Phi ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博