被扫地出门18个月后，马斯克终复仇OpenAI_伊隆·马斯克|openai

文章图片

文章图片

文章图片

18个月前，马斯克被OpenAI扫地出门；18个月后，他带着Grok 3强势回归，直接将OpenAI拉下神坛。
昨天，马斯克发布的Grok 3大模型不仅在性能上超越了OpenAI的GPT-4o ，还在推理、编程和多模态能力上展现出惊人的实力。
从被踢出OpenAI到创建xAI实验室，再到如今的复仇成功，马斯克用“暴力开源”策略撕裂了OpenAI的闭源壁垒。而OpenAI的山姆·奥特曼也毫不示弱，声称GPT-4.5将带来AGI的初体验。
这场AI领域的权力天平正在倾斜，而开源与闭源的路线之争，或许才是这场战争的真正焦点。

2月18日，马斯克发布完Grok 3大模型后，转发了一条推特：
划重点， Grok3目前世界第一强模型（竞技场得分1400），比OpenAI的推理模型还厉害， 18个月就超越了山姆·奥特曼领导下的OpenAI 。
要知道马斯克曾是OpenAI的天使投资人，甚至Open这个关键词就是马斯克帮取名的。变化发生在2018年，奥特曼与马斯克在“开源还是闭源”的问题上彻底决裂。马斯克坚信，人工智能必须透明开放以规避风险；而奥特曼则在资本压力下选择与微软结盟，将技术封闭于商业护城河内。
此前大家都相安无事，因为当时ChatGPT还没那么厉害。就在2022年末， ChatGPT4横空出世后，马斯克对于被踢出了这么一个跨时代项目，就开始碎碎念了。应了那句话：『不怕分手，就怕前任过得好。』
这段往事在2024年再度被点燃。马斯克以“违背公益初衷”为由，对OpenAI发起诉讼，指控其将技术垄断权拱手让给微软。这场官司虽未胜诉，却为马斯克埋下了一颗复仇的种子——2023年7月，马斯克成立xAI实验室，开始发布Grok系列模型，对标OpenAI的GPT系列模型。

01 大力出奇迹， 18个月追上OpenAI在Grok3发布会上，开场xAI介绍了他们的决心：
『122天，建成了10万显卡集群，再过了92天后，建成了20万张 H100 显卡集群。』这是世界上最大的H100算力集群。
很多朋友不懂这个数据的意义，这意味着Grok3训练算力超过了DeepSeek V3的263倍，却只带来超过DeepSeek 33%的Benchmark能力。
Scaling Law是否失效暂且不提，就说这大手笔投入算力基础设施，也算是体现了马斯克追赶的决心。
短短2年内， xAI接连推出Grok系列模型：从参数量为3140亿的Grok-1 ，到支持多模态的Grok-1.5 Vision ，追赶ChatGPT 4o的Grok 2 ，以及今天登顶的Grok 3 ， Grok每一步都试图用“暴力开源”策略撕裂OpenAI的闭源壁垒。
重要时间节点是在2024年底。 xAI在田纳西州孟菲斯建成了一座堪比“算力核电站”的数据中心， 10万块英伟达H100 GPU组成的集群，让Grok 3的训练速度比前代提升十倍。马斯克在推特上写道：“算力即权力，而我们将拥有最暴力的武器。 ”
此后马斯克宣布融资60亿美元，继续投资Grok大模型的训练。这笔钱比国内大模型六小虎的融资总额还多。
在xAI成立的18个月（不到2年时间）后， Grok 3正式发布，成功登顶最强大模型。

02 Grok 3的“量子跃升” ，有何杀手锏？2025年2月18日，全球百万观众涌入直播平台，见证马斯克的最新大模型，此前他在中东的AI大会上，宣布将发布全球最聪明的大模型Grok 3 。现在看来Grok 3名副其实，具有诸多强悍能力。

技术核爆点一：最聪明的模型基准测试数据显示， Grok 3达到了1400的Elo得分，这是其他任何模型都未曾达到的。
Grok 3在AIME 2025科学推理测试中得分超过Gemini 2 Pro和GPT-4o ，其迷你版模型甚至在编程任务中击败了DeepSeek-R1 。
可能大家已经被大模型刷榜测试的传闻，搞得不太相信这些数据的真实性。国外有拿到Grok 3测试的大神，测试了超过人类和一些大模型理解的《卡坦岛》问题：。

“创建一个显示六边形网格的棋盘游戏网页，就像游戏中的 Settlers of Catan 一样。每个六边形网格的编号从 1 到 N ，其中 N 是六边形瓷砖的总数。使其通用，以便可以使用滑块更改“环”的数量。例如，在 Catan 中半径为 3 个六边形。请使用单个 html 页面。 ”

他评价很少有模型能够可靠地做到这一点。顶级的 OpenAI 思维模型（例如 o1-pro ，每月 200 美元）也能做到这一点，但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都没有做到这一点。
甚至数学历史上著名的未接知名『黎曼猜想』， Grok 3也会尝试去算，不像O1-Pro、Claude等模型直接回答做不了，放弃了。
【被扫地出门18个月后，马斯克终复仇OpenAI】
技术核爆点二：动态反思机制Grok 3引入“思维链”推理技术，能像人类一样拆解复杂任务并实时修正逻辑断层。现场演示中， Grok 3仅用30秒便生成了一份从地球到火星的航天器轨迹图，并标注出引力弹弓效应的最佳利用节点。

『你能看到Grok真的在做一些模糊思考，这样模型就不会被立即完全复制。』

图中可以看到，在数学测试中， Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分，超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。
同样在科学和编程两项中， Grok3两款模型也存在一定程度上的领先。

技术核爆点三：更多呈现模式Grok 3不仅能解锁测试时间计算，还能启用强大的代理。这些能力促成了一款名为DeepSearch的新产品。 “下一代搜索代理，用于理解宇宙” 。 DeepSearch还会展示它进行搜索时所采取的步骤。
不仅如此， Elon强调了Grok 3的创意涌现能力。在这个和DeepSeek十分相似的页面上， Grok新增了第三个标签按钮『Big Brain』。使用“大脑模式” ，通过更多计算资源和推理来使用Grok 3 ，也许会呈现意想不到的效果。
未来Grok 3应该不太限制大模型的创作风格，以及思考创意的边界。相比之下， OpenAI则是解除了ChatGPT的成人内容限制，这就。。。。。

03 口水战打不完，奥特曼的反击面对Grok 3的突袭， OpenAI并非毫无动作。
发布会前天，山姆·奥特曼在X平台宣称：“GPT-4.5将带来AGI的初体验。 ”预计GPT-4.5也会在一两周内发布，届时拿出满血的O3 ，应该能夺回全球最佳模型的宝座。
此前，一个由马斯克牵头的财团拟出价 974 亿美元收购 OpenAI ，后者的首席执行官萨姆?阿尔特曼对此回应称， ” 不用了，谢谢，但如果你愿意，我们可以以 97.4 亿美元的价格收购推特（即如今的 X）”后。
商业竞争互相都不手软，口水战也打个不停。
未来两家公司还存在路线竞争。与OpenAI的闭源策略针锋相对， Grok 3承诺未来“开源” ， Grok 2将在一个月内开源，并计划接入特斯拉车载系统和Optimus人形机器人。
同时， xAI同步推出了“Super Grok”订阅服务，以每月49美元的价格向开发者开放深度搜索（DeepSearch）功能——这种能交叉验证信息来源、公开推理路径的引擎，直指ChatGPT的“黑箱”痛点。
更深层的冲击来自生态层面。 Grok 3的开源策略吸引了大量开发者涌入，而特斯拉的硬件布局（如Model Q车载系统）则为AI落地提供了现实场景。
2025年， AI领域的权力天平正在倾斜。 Grok 3的颠覆性不仅在于技术，更在于它重新点燃了“开源理想主义”的火种。正如一位硅谷投资人所言：“马斯克用Grok 3完成了一场迟到的复仇，但这场战争的真正赢家，或许是那些终于看见技术透明曙光的人们。 ”
山姆·奥特曼会拿出怎样的竞争手段回击呢？
作者丨鲸哥
本文由人人都是产品经理作者【AI鲸选社】，微信公众号：【鲸选AI】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。
题图来自Unsplash ，基于 CC0 协议。