【开源传媒互联网|周观点】关注大模型进化，继续布局 AI 应用/语料/微信电商

文娱透光镜 · 公众号 · · 2024-12-29 23:06

文章预览

本报告摘自：《开源证券_行业周报_关注大模型进化，继续布局AI应用语料微信电商_传媒互联网团队_20241229 》研报首发时间：2024年12月29日核心观点 · 高性能低成本 DeepSeek-V3 模型发布，积极把握 AI 应用及 3D 数据语料机会 12 月 26 日，深度求索发布自研 MoE 全新系列模型 DeepSeek-V3 首个版本并同步开源，其拥有 671B 参数（激活 37B ），在 14.8T token 上进行了预训练，且多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，在性能上和世界头部闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 接近，且生成吐字速度从 20 TPS 提升 3 倍至 60 TPS ，模型 API 服务定价却下降至每百万输入 tokens 0.5 元（缓存命中） / 2 元（缓存未命中）及每百万输出 tokens 8 元。更高性能且更低成本的 DeepSeek V3 模型发布及近期豆包视觉理解模型等字节 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

凤凰网股票 · 中国富豪之子张康阳在意甲被资本“偷家”细节曝光：当初借款很卑微一年光利息3000多万欧元

8 月前

机器学习AI算法工程 · NLP实战四：Pytorch实现TextRCNN文本分类

6 月前

北京大学重庆大数据研究院 · 研究院多项成果亮相第十二届中国（绵阳）科技城国际科技博览会

2 月前

北京大学重庆大数据研究院 · 研究院多项成果亮相第十二届中国（绵阳）科技城国际科技博览会

2 月前