专栏名称: 思诺财富

本号以金融知识学习、财经资讯分享、研究报告交流为核心，交流学习，共同进步。被市场认可的逻辑才有价值，而这种认可会在趋势上呈现出来，趋势分析为主，价值分析为辅，逻辑推理为核心。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

卖飞2个板…昨收20cm标逆势板块

思诺财富 · 公众号 · · 2024-12-27 17:38

主要观点总结

文章主要介绍了国产大模型DeepSeek-V3的训练成本、效率及在全球范围内的关注度。DeepSeek透露了训练关键数据，其高效和对算力资源依赖之小令人瞩目。同时，提到了市场展望、相关投资机会和股市投资的风险提示。

关键观点总结

关键观点1: DeepSeek-V3训练成本及效率

DeepSeek-V3的训练成本为557万美元，包含正式训练的成本，但不包括先前研究或精简实验的成本。该模型在预训练阶段每个万亿标记上只需要180K H800 GPU小时，显示出高效率。

关键观点2: 全球关注度及市场展望

DeepSeek-V3的火爆全球引发广泛关注，文章还讨论了市场展望和投资机会，特别提到了铌酸锂等相关题材。

关键观点3: 股市风险提示

文章强调了股市的风险和投资需谨慎的提示，提醒读者注意投资风险，并指出文章内容仅供参考，不构成任何投资建议。

文章预览

免责声明：文章内容仅为研究参考资料，仅以学习交流，传播知识为目的，文中所涉及的所有个股都不构成投资建议【温馨提示】股市有风险，投资需谨慎。 🧭方向 🛤️连板 🏅️主线 🎬发酵特 🌈题材 🦄独立 📰事件特国产大模型DeepSeek-V3一夜火爆全球，671B的MoE，训练成本仅558万美元 DeepSeek V3刷屏，550万元2000张卡做出的开源模型，和OpenAI几亿烧出来的一样好在这个报告中， Deepseek 透露了训练的关键数据，其中最引人注目的，是它的高效和对算力资源依赖之小，同时效果又异常的好—— “在预训练阶段，在每个万亿标记上训练 DeepSeek-V3 只需要 180K H800 GPU 小时，也就是说，在我们的具有 2048 个 H800 GPU 的集群上需要 3.7 天。因此，我们的预训练阶段在不到两个月的时间内完成，成本为 2664K GPU 小时。结合 119K GPU 小时的上下文长度扩展和 5 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博