主要观点总结
本文介绍了马斯克发布的Grok3模型,包括其计算资源的使用、模型能力、推理能力、深度搜索功能、使用方式和收费、未来规划等。
关键观点总结
关键观点1: Grok3模型的发布和背景
马斯克在直播活动中发布了Grok3模型,该模型是对之前计算中心的预热结果。马斯克声称其计算资源使用是前身的10倍,并在一期工程中仅用了122天完成。
关键观点2: Grok3模型的能力
Grok 3的训练量是Grok 2的10倍,并在基准测试中显著优于其他模型。它包含两个版本,即Grok3和Grok3-mini,目前早期版本在LLM竞技场排名第一。此外,Grok3具备推理能力,并在代码能力和思考过程中展现出优势。
关键观点3: Grok3的深度搜索功能和Agent能力
Grok3支持深度搜索功能,能够深入思考用户意图、考虑事实、浏览网站、交叉验证信息来源等。此外,其Agent能力也必须跟上,公开执行搜索的步骤。
关键观点4: Grok3的使用、收费和未来规划
目前,最先可以体验Grok3的渠道是推特的X Premium+会员。此外,还有单独的Grok网站和APP以及Super Grok会员。未来,网页和应用的所有功能将在一周内全面推出,API将在几周内推出。还有语音应用即将推出,Grok2将在几个月后开源。
文章预览
从 24 年底马斯克就开始给他们新建巨大计算中心训练的 Grok3 模型开始预热了,今天中午 12 点的直播活动中终于发布了 Grok3。 这次马斯克开始玩真的了,不仅模型的素质跟上了 Open AI 的 O1,而且在产品功能上全面对标 ChatGPT。 训练的硬件 Musk 声称 Grok 3 的开发使用了比其前身 Grok 2“10 倍”多的计算资源,xAI 一直在使用位于孟菲斯的一个庞大数据中心—— 一个包含约 20 万个 GPU 的数据中心 ——来训练 Grok 3。其中的一期工程只用了 122 天就完成了,工程这块还得看马斯克。 模型能力 Grok 3 的训练量是 Grok 2 的 10 倍,在 1 月初完成了预训练,即使现在依然在训练过程中。 Grok3 包含两个模型版本 Grok3 和 Grok3-mini,Grok 3 AIME 和 GPQA 在内的基准测试中显著优于其他模型,如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表现不错。 目前的早期版本在 Elo 机
………………………………