今天看啥  ›  专栏  ›  我的投资会

超过谷歌的机会

我的投资会  · 公众号  ·  · 2024-12-28 19:27
    

文章预览

在微信公众号目前的算法下,为了及时看到,建议星标☆我的投资会。 李想访谈说,AI是超过谷歌的大机会。 最近幻方悄悄上线了DeepSeek V3, 作为量化巨头,幻方一向是中国大模型价格战的发动者,当时DeepSeek v2出圈也是因为做到好用又便宜,盛传幻方是中国持有高性能GPU最多的公司。 有人做了初步评测,结论就是:已经与GPT-4o、Claude-3.5-sonnet推理能力相当,甚至编程媲美最领先的3.5 Sonnet,超过GPT-4o。 今天出圈并对市场有所扰动的信息是是: 这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.4 万 H800 GPU Hours, 再加上上下文扩展与后训练的训练,总共也只有 278.8 H800 GPU Hours。相较之下,Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU Hours—— 如此计算量足可训练 DeepSeek-V3 至少 15 次。 几乎所有投资者圈层都在问:幻方Deepseek v3只用了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览