专栏名称: 晚点LatePost
互联网科技博主
目录
相关文章推荐
今天看啥  ›  专栏  ›  晚点LatePost

#DeepSeek-V3训练仅花费558万美元#【中国量化私募支-20241227222701

晚点LatePost  · 微博  ·  · 2024-12-27 22:27
    

文章预览

2024-12-27 22:27 本条微博链接 #DeepSeek-V3训练仅花费558万美元# 【中国量化私募支持的创业公司,把大模型训练成本降到 600 万美元】量化私募幻方支持的大模型公司 DeepSeek 开源新款模型 DeepSeek-V3,宣称效果超过 Meta 开源的 Llama 3.1,比肩 GPT-4o、Claude 3.5 Sonnet——目前效果领先的基础模型。据 DeepSeek 报告,DeepSeek-v3 用了 14.8 T 的数据集训练,参数达到 6710 亿,但训练成本只有 557.6 万美元(约合 4070 万人民币),相当于 Llama 3.1 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览