注册
登录
专栏名称:
调研心得
分享调研纪要,上市公司年报季报交流,及股东会纪要
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
何夕
·
美资一定会救英伟达,就像中国机构一会救寒武纪 ...
·
昨天
硅谷王川
·
人其实不需要什么朋友。需要的是合作伙伴。只有 ...
·
昨天
何夕
·
蛇年发财! -20250129000249
·
2 天前
今天看啥
›
专栏
›
调研心得
周末,超级大瓜!
调研心得
·
公众号
·
投资
· 2025-01-26 20:14
文章预览
周末AI科技圈出了一个大瓜,国产模型Deepseek彻底出圈了,引发了海外科技大厂的热议。 Deepseek是幻方量化开发的开源模型。幻方量化的创始人是梁文锋,17岁考入浙大,07年拿到浙大信息与通信工程硕士学位,08年开始创业搞量化私募,18年达到百亿规模,21年达到千亿规模。 梁文锋在搞私募的过程中积累了足够的资金和上万张英伟达的GPU算力卡,成为国内除互联网大厂以外少数拥有万卡规模的企业。 23年ChatGPT火了以后,梁文锋带领核心团队成立了深度求索公司,专注研发Deepseek大模型。 24年深度求索公司正式推出了V3模型,这个模型最大的优势就是训练成本非常低,V3的训练参数是671B,一共只使用了2000张GPU,花费280万GPU小时训练,合计成本不到600万美金。 相比之下,Meta的Lama3模型了使用了1.6万张GPU,花费了3930万GPU小时,耗资数亿美金,训练一次La ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
何夕
·
美资一定会救英伟达,就像中国机构一会救寒武纪一样…这里面涉及的利-20250129112117
昨天
硅谷王川
·
人其实不需要什么朋友。需要的是合作伙伴。只有买卖关系,金钱交易发-20250129021303
昨天
何夕
·
蛇年发财! -20250129000249
2 天前
陕西果业
·
陕西日报 :以猕猴桃为突破口,陕西周至打造乡村振兴新IP
6 月前
求职汇
·
信银理财2025届校园招聘正式启动
2 月前