#DeepSeek-V3训练仅花费558万美元#【中国量化私募支-20241227222701

晚点LatePost · 微博 · · 2024-12-27 22:27

文章预览

2024-12-27 22:27 本条微博链接 #DeepSeek-V3训练仅花费558万美元# 【中国量化私募支持的创业公司，把大模型训练成本降到 600 万美元】量化私募幻方支持的大模型公司 DeepSeek 开源新款模型 DeepSeek-V3，宣称效果超过 Meta 开源的 Llama 3.1，比肩 GPT-4o、Claude 3.5 Sonnet——目前效果领先的基础模型。据 DeepSeek 报告，DeepSeek-v3 用了 14.8 T 的数据集训练，参数达到 6710 亿，但训练成本只有 557.6 万美元（约合 4070 万人民币），相当于 Llama 3.1 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博