专栏名称: code秘密花园
这里有最前沿的前端技术、最新的前端消息、最精品的技术文章、最好用的工具推荐、还有一个有趣的作者。
今天看啥  ›  专栏  ›  code秘密花园

刚刚,马斯克推出全新大模型,多项指标超越 DeepSeek!

code秘密花园  · 公众号  ·  · 2025-02-18 13:10
    

文章预览

就在刚刚,马斯克旗下的人工智能公司 xAI 发布了全新的大模型 Grok3。 xAI 称,Grok 3 的研发因为他们的 “巨像” 超级计算机而大大提速,这台超级计算机仅用 8 个月就造好了。这个系统配备了 10 万个英伟达 H100 图形处理器,为训练提供了 2 亿个 GPU 小时,是上一代 Grok 2 的 10 倍。计算资源的大幅提升,让 Grok 3 能更高效地处理海量数据,不仅缩短了训练时间,还提高了准确率。 除了增强计算能力,xAI 还调整训练方法提升 Grok 3 性能,采用了合成数据集、自我纠错机制和强化学习: 合成数据集:人工生成,模拟各种场景,保证数据多样可控,提高学习效率,解决数据隐私问题。 自我纠错机制:模型能评估自身答案,与正确答案对比,优化答案,减少错误,提高准确率。 强化学习:模型通过行动获奖励或惩罚来学习,不断试错,最大化正面结果, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览