专栏名称: 思诺财富
本号以金融知识学习、财经资讯分享、研究报告交流为核心,交流学习,共同进步。被市场认可的逻辑才有价值,而这种认可会在趋势上呈现出来,趋势分析为主,价值分析为辅,逻辑推理为核心。
目录
相关文章推荐
今天看啥  ›  专栏  ›  思诺财富

卖飞2个板…昨收20cm标逆势板块

思诺财富  · 公众号  ·  · 2024-12-27 17:38
    

主要观点总结

文章主要介绍了国产大模型DeepSeek-V3的训练成本、效率及在全球范围内的关注度。DeepSeek透露了训练关键数据,其高效和对算力资源依赖之小令人瞩目。同时,提到了市场展望、相关投资机会和股市投资的风险提示。

关键观点总结

关键观点1: DeepSeek-V3训练成本及效率

DeepSeek-V3的训练成本为557万美元,包含正式训练的成本,但不包括先前研究或精简实验的成本。该模型在预训练阶段每个万亿标记上只需要180K H800 GPU小时,显示出高效率。

关键观点2: 全球关注度及市场展望

DeepSeek-V3的火爆全球引发广泛关注,文章还讨论了市场展望和投资机会,特别提到了铌酸锂等相关题材。

关键观点3: 股市风险提示

文章强调了股市的风险和投资需谨慎的提示,提醒读者注意投资风险,并指出文章内容仅供参考,不构成任何投资建议。


文章预览

免责声明 :文章内容仅为研究参考资料,仅以学习交流,传播知识为目的, 文中所涉及的所有个股都不构成投资建议 【温馨提示】 股市有风险 , 投资需谨慎 。 🧭方向 🛤️连板 🏅️主线 🎬发酵 特 🌈题材 🦄独立 📰事件 特 国产大模型DeepSeek-V3一夜火爆全球,671B的MoE,训练成本仅558万美元 DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好 在这个报告中, Deepseek 透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又异常的好—— “在预训练阶段,在每个万亿标记上训练 DeepSeek-V3 只需要 180K H800 GPU 小时,也就是说,在我们的具有 2048 个 H800 GPU 的集群上需要 3.7 天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为 2664K GPU 小时。结合 119K GPU 小时的上下文长度扩展和 5 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览