文章预览
2024-12-27 22:27
本条微博链接
#DeepSeek-V3训练仅花费558万美元# 【中国量化私募支持的创业公司,把大模型训练成本降到 600 万美元】量化私募幻方支持的大模型公司 DeepSeek 开源新款模型 DeepSeek-V3,宣称效果超过 Meta 开源的 Llama 3.1,比肩 GPT-4o、Claude 3.5 Sonnet——目前效果领先的基础模型。据 DeepSeek 报告,DeepSeek-v3 用了 14.8 T 的数据集训练,参数达到 6710 亿,但训练成本只有 557.6 万美元(约合 4070 万人民币),相当于 Llama 3.1
………………………………