4o-mini只有8B，o1也才300B！微软论文意外曝光GPT核心机密

量子位 · 公众号 · AI · 2025-01-02 10:55

主要观点总结

微软在论文中意外泄露了OpenAI一些模型的参数，包括GPT-4的参数估计为1.76T，以及其他模型的参数如Claude 3.5 Sonnet等。尽管论文中有免责声明表示这些数字是估计的，但它们仍然引起了广泛的关注和讨论。微软之前也曾有过类似情况，被质疑是否故意泄露信息。这篇论文的主要焦点是介绍一项与医学相关的benchmark——MEDEC，它旨在识别并纠正临床笔记中的错误。基于这次泄露的参数估计，网友们提出了一些观点和猜测。同时，他们也关注OpenAI是否会公布确切的数字。此外，文章还提到了其他一些与AI相关的话题和链接。

关键观点总结

关键观点1: 微软论文意外泄露OpenAI模型参数

论文中提到了OpenAI的一些模型参数，包括GPT-4的参数估计为1.76T，以及一些其他模型的参数估计。

关键观点2: 免责声明与网友质疑

论文中包含一个免责声明，表示所提到的数字大部分是估计的。然而，这并没有阻止网友对泄露信息的猜测和质疑。

关键观点3: 微软论文关注的MEDEC项目

论文主要介绍了MEDEC项目，这是一个旨在识别并纠正临床笔记中的错误的benchmark。该项目使用LLMs（大语言模型）来完成这项任务。

关键观点4: 网友对模型参数的关注与猜测

网友关注OpenAI是否会公布确切的数字，并对一些模型的参数进行了猜测和讨论。

关键观点5: 其他与AI相关的话题和链接

文章还提到了其他一些与AI相关的话题和链接，包括量子位年度AI主题策划等。

文章预览

梦晨一水发自凹非寺量子位 | 公众号 QbitAI 微软又把OpenAI的机密泄露了？？在论文中明晃晃写着： o1-preview 约300B参数， GPT-4o 约200B， GPT-4o-mini 约8B…… ‍ 英伟达2024年初发布B200时，就摊牌了 GPT-4 是1.8T MoE也就是1800B，这里微软的数字更精确，为 1.76T 。除此之外，论文中给OpenAI的mini系列，Claude3.5 Sonnet也都附上了参数，总结如下： o1-preview约300B；o1-mini约100B GPT-4o约200B；GPT-4o-mini约8B Claude 3.5 Sonnet 2024-10-22版本约175B 微软自己的Phi-3-7B，这个不用约了就是7B 虽然论文中后面也有免责声明：确切数据尚未公开，这里大部分数字是估计的。但还是有不少人觉得事情没这么简单。比如为什么唯独没有放谷歌Gemini模型的参数估计？或许他们对放出来的数字还是有信心的。也有人认为，大多数模型都是在英伟达GPU上运行的，所以可以通过token生成速度来估计。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【[40星]python_readiness：帮你轻松检查Pyt-20250222130528

昨天

爱可可-爱生活 · RocketKV 创新性地提出了一种两阶段 KV 缓存压缩方法，-20250222055734

昨天

黄建同学 · 有相仿的地方。在MoE中，动态路由选择的核心原理类似于“智能调度-20250221075034

2 天前

量子位 · 安卓装DeepSeek就敢卖8999！最薄折叠？那没事了

2 天前

黄建同学 · 小知识，hf_transfer能够比HF的下载速度快10-100-20250220183052

2 天前

印象笔记 · 印象笔记文件库、云字体品质升级，思维导图交互优化｜功能更新速览

9 月前

生物世界 · 张锋在北大的报告，重点介绍了两种新型基因编辑系统和两种新型递送系统

9 月前

bookthing · 原来这并没有那么难

8 月前

界面新闻 · 长安银行股权拍卖意外中止，此前陷入12亿存款去向不明“罗生门”

6 月前

舰大官人 · 我就问你一句话：更大规模的瀑布，你想看见吗？请说心里话。 -20240830203910

5 月前