专栏名称: 调研心得
分享调研纪要,上市公司年报季报交流,及股东会纪要
今天看啥  ›  专栏  ›  调研心得

周末,超级大瓜!

调研心得  · 公众号  · 投资  · 2025-01-26 20:14
    

文章预览

周末AI科技圈出了一个大瓜,国产模型Deepseek彻底出圈了,引发了海外科技大厂的热议。 Deepseek是幻方量化开发的开源模型。幻方量化的创始人是梁文锋,17岁考入浙大,07年拿到浙大信息与通信工程硕士学位,08年开始创业搞量化私募,18年达到百亿规模,21年达到千亿规模。 梁文锋在搞私募的过程中积累了足够的资金和上万张英伟达的GPU算力卡,成为国内除互联网大厂以外少数拥有万卡规模的企业。 23年ChatGPT火了以后,梁文锋带领核心团队成立了深度求索公司,专注研发Deepseek大模型。 24年深度求索公司正式推出了V3模型,这个模型最大的优势就是训练成本非常低,V3的训练参数是671B,一共只使用了2000张GPU,花费280万GPU小时训练,合计成本不到600万美金。 相比之下,Meta的Lama3模型了使用了1.6万张GPU,花费了3930万GPU小时,耗资数亿美金,训练一次La ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览