专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

量子位  · 公众号  · AI  · 2025-01-02 10:55
    

主要观点总结

微软在论文中意外泄露了OpenAI一些模型的参数,包括GPT-4的参数估计为1.76T,以及其他模型的参数如Claude 3.5 Sonnet等。尽管论文中有免责声明表示这些数字是估计的,但它们仍然引起了广泛的关注和讨论。微软之前也曾有过类似情况,被质疑是否故意泄露信息。这篇论文的主要焦点是介绍一项与医学相关的benchmark——MEDEC,它旨在识别并纠正临床笔记中的错误。基于这次泄露的参数估计,网友们提出了一些观点和猜测。同时,他们也关注OpenAI是否会公布确切的数字。此外,文章还提到了其他一些与AI相关的话题和链接。

关键观点总结

关键观点1: 微软论文意外泄露OpenAI模型参数

论文中提到了OpenAI的一些模型参数,包括GPT-4的参数估计为1.76T,以及一些其他模型的参数估计。

关键观点2: 免责声明与网友质疑

论文中包含一个免责声明,表示所提到的数字大部分是估计的。然而,这并没有阻止网友对泄露信息的猜测和质疑。

关键观点3: 微软论文关注的MEDEC项目

论文主要介绍了MEDEC项目,这是一个旨在识别并纠正临床笔记中的错误的benchmark。该项目使用LLMs(大语言模型)来完成这项任务。

关键观点4: 网友对模型参数的关注与猜测

网友关注OpenAI是否会公布确切的数字,并对一些模型的参数进行了猜测和讨论。

关键观点5: 其他与AI相关的话题和链接

文章还提到了其他一些与AI相关的话题和链接,包括量子位年度AI主题策划等。


文章预览

梦晨 一水 发自 凹非寺 量子位 | 公众号 QbitAI 微软又把OpenAI的机密泄露了??在论文中明晃晃写着: o1-preview 约300B参数, GPT-4o 约200B, GPT-4o-mini 约8B…… ‍ 英伟达2024年初发布B200时,就摊牌了 GPT-4 是1.8T MoE也就是1800B,这里微软的数字更精确,为 1.76T 。 除此之外,论文中给OpenAI的mini系列,Claude3.5 Sonnet也都附上了参数,总结如下: o1-preview约300B;o1-mini约100B GPT-4o约200B;GPT-4o-mini约8B Claude 3.5 Sonnet 2024-10-22版本约175B 微软自己的Phi-3-7B,这个不用约了就是7B 虽然论文中后面也有免责声明: 确切数据尚未公开,这里大部分数字是估计的。 但还是有不少人觉得事情没这么简单。 比如为什么唯独没有放谷歌Gemini模型的参数估计?或许他们对放出来的数字还是有信心的。 也有人认为,大多数模型都是在英伟达GPU上运行的,所以可以通过token生成速度来估计。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览