文章预览
本报告摘自:《 开源证券_行业周报_关注大模型进化,继续布局AI应用语料微信电商_传媒互联网团队_20241229 》 研报首发时间:2024年12月29日 核心观点 · 高性能低成本 DeepSeek-V3 模型发布,积极把握 AI 应用及 3D 数据语料机会 12 月 26 日,深度求索发布自研 MoE 全新系列模型 DeepSeek-V3 首个版本并同步开源,其拥有 671B 参数(激活 37B ),在 14.8T token 上进行了预训练,且多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,在性能上和世界头部闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 接近,且生成吐字速度从 20 TPS 提升 3 倍至 60 TPS ,模型 API 服务定价却下降至每百万输入 tokens 0.5 元(缓存命中) / 2 元(缓存未命中)及每百万输出 tokens 8 元。 更高性能且更低成本的 DeepSeek V3 模型发布及近期豆包视觉理解模型等字节
………………………………