专栏名称: 程序猿
本微信公众号:imkuqin,为程序员提供最新最全的编程学习资料的查询。目前已经开通PHP、C/C++函数库、.NET Framework类库、J2SE API查询功能。
今天看啥  ›  专栏  ›  程序猿

DeepSeek V3架构图;微软论文意外曝光GPT机密:4o-mini只有8B,o1也才300B;阿里云与零一万物达成战略合作

程序猿  · 公众号  · 程序员  · 2025-01-05 23:27
    

文章预览

0、DeepSeek V3 架构图 1、微软论文意外曝光GPT核心机密:4o-mini只有8B,o1也才300B 微软在一篇论文(https://arxiv.org/abs/2412.19260)中意外披露了OpenAI的模型参数,包括o1-preview约3000亿参数,GPT-4o约2000亿参数,以及GPT-4o-mini约80亿参数。 此外,论文还提及了英伟达将在2024年初发布的B200模型,其参数为1.8万亿,与此前关于GPT-4作为1.8T MoE(1800亿参数)的说法相近,但微软给出的GPT-4参数更为精确,为1.76万亿。这一披露引发了业界广泛关注。 2、阿里云与零一万物达成战略合作,成立 “产业大模型联合实验室” 近期,阿里云和大模型头部企业零一万物达成模型平台业务的战略合作,双方将成立 “产业大模型联合实验室”,联手加速大模型从技术到应用的落地,进一步扩大产业大模型的生态整合。据了解, 双方深度战略合作的产业大模型联合实验室包含技术、 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览