
文章图片

文章图片

文章图片
18个月前 , 马斯克被OpenAI扫地出门;18个月后 , 他带着Grok 3强势回归 , 直接将OpenAI拉下神坛 。2月18日 , 马斯克发布完Grok 3大模型后 , 转发了一条推特:
昨天 , 马斯克发布的Grok 3大模型不仅在性能上超越了OpenAI的GPT-4o , 还在推理、编程和多模态能力上展现出惊人的实力 。
从被踢出OpenAI到创建xAI实验室 , 再到如今的复仇成功 , 马斯克用“暴力开源”策略撕裂了OpenAI的闭源壁垒 。 而OpenAI的山姆·奥特曼也毫不示弱 , 声称GPT-4.5将带来AGI的初体验 。
这场AI领域的权力天平正在倾斜 , 而开源与闭源的路线之争 , 或许才是这场战争的真正焦点 。
划重点 , Grok3目前世界第一强模型(竞技场得分1400) , 比OpenAI的推理模型还厉害 , 18个月就超越了山姆·奥特曼领导下的OpenAI 。
要知道马斯克曾是OpenAI的天使投资人 , 甚至Open这个关键词就是马斯克帮取名的 。 变化发生在2018年 , 奥特曼与马斯克在“开源还是闭源”的问题上彻底决裂 。 马斯克坚信 , 人工智能必须透明开放以规避风险;而奥特曼则在资本压力下选择与微软结盟 , 将技术封闭于商业护城河内 。
此前大家都相安无事 , 因为当时ChatGPT还没那么厉害 。 就在2022年末 , ChatGPT4横空出世后 , 马斯克对于被踢出了这么一个跨时代项目 , 就开始碎碎念了 。 应了那句话:『不怕分手 , 就怕前任过得好 。 』
这段往事在2024年再度被点燃 。 马斯克以“违背公益初衷”为由 , 对OpenAI发起诉讼 , 指控其将技术垄断权拱手让给微软 。 这场官司虽未胜诉 , 却为马斯克埋下了一颗复仇的种子——2023年7月 , 马斯克成立xAI实验室 , 开始发布Grok系列模型 , 对标OpenAI的GPT系列模型 。
01 大力出奇迹 , 18个月追上OpenAI在Grok3发布会上 , 开场xAI介绍了他们的决心:
『122天 , 建成了10万显卡集群 , 再过了92天后 , 建成了20万张 H100 显卡集群 。 』这是世界上最大的H100算力集群 。
很多朋友不懂这个数据的意义 , 这意味着Grok3训练算力超过了DeepSeek V3的263倍 , 却只带来超过DeepSeek 33%的Benchmark能力 。
Scaling Law是否失效暂且不提 , 就说这大手笔投入算力基础设施 , 也算是体现了马斯克追赶的决心 。
短短2年内 , xAI接连推出Grok系列模型:从参数量为3140亿的Grok-1 , 到支持多模态的Grok-1.5 Vision , 追赶ChatGPT 4o的Grok 2 , 以及今天登顶的Grok 3 , Grok每一步都试图用“暴力开源”策略撕裂OpenAI的闭源壁垒 。
重要时间节点是在2024年底 。 xAI在田纳西州孟菲斯建成了一座堪比“算力核电站”的数据中心 , 10万块英伟达H100 GPU组成的集群 , 让Grok 3的训练速度比前代提升十倍 。 马斯克在推特上写道:“算力即权力 , 而我们将拥有最暴力的武器 。 ”
此后马斯克宣布融资60亿美元 , 继续投资Grok大模型的训练 。 这笔钱比国内大模型六小虎的融资总额还多 。
在xAI成立的18个月(不到2年时间)后 , Grok 3正式发布 , 成功登顶最强大模型 。
02 Grok 3的“量子跃升” , 有何杀手锏?2025年2月18日 , 全球百万观众涌入直播平台 , 见证马斯克的最新大模型 , 此前他在中东的AI大会上 , 宣布将发布全球最聪明的大模型Grok 3 。 现在看来Grok 3名副其实 , 具有诸多强悍能力 。
技术核爆点一:最聪明的模型基准测试数据显示 , Grok 3达到了1400的Elo得分 , 这是其他任何模型都未曾达到的 。
Grok 3在AIME 2025科学推理测试中得分超过Gemini 2 Pro和GPT-4o , 其迷你版模型甚至在编程任务中击败了DeepSeek-R1 。
可能大家已经被大模型刷榜测试的传闻 , 搞得不太相信这些数据的真实性 。 国外有拿到Grok 3测试的大神 , 测试了超过人类和一些大模型理解的《卡坦岛》问题: 。
“创建一个显示六边形网格的棋盘游戏网页 , 就像游戏中的 Settlers of Catan 一样 。 每个六边形网格的编号从 1 到 N , 其中 N 是六边形瓷砖的总数 。 使其通用 , 以便可以使用滑块更改“环”的数量 。 例如 , 在 Catan 中半径为 3 个六边形 。 请使用单个 html 页面 。 ”他评价很少有模型能够可靠地做到这一点 。 顶级的 OpenAI 思维模型(例如 o1-pro , 每月 200 美元)也能做到这一点 , 但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都没有做到这一点 。
甚至数学历史上著名的未接知名『黎曼猜想』 , Grok 3也会尝试去算 , 不像O1-Pro、Claude等模型直接回答做不了 , 放弃了 。
【被扫地出门18个月后,马斯克终复仇OpenAI】
技术核爆点二:动态反思机制Grok 3引入“思维链”推理技术 , 能像人类一样拆解复杂任务并实时修正逻辑断层 。 现场演示中 , Grok 3仅用30秒便生成了一份从地球到火星的航天器轨迹图 , 并标注出引力弹弓效应的最佳利用节点 。
『你能看到Grok真的在做一些模糊思考 , 这样模型就不会被立即完全复制 。 』图中可以看到 , 在数学测试中 , Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分 , 超越了o3mini的87分、o1的83分和DeepSeek-R1的80分 。
同样在科学和编程两项中 , Grok3两款模型也存在一定程度上的领先 。
技术核爆点三:更多呈现模式Grok 3不仅能解锁测试时间计算 , 还能启用强大的代理 。 这些能力促成了一款名为DeepSearch的新产品 。 “下一代搜索代理 , 用于理解宇宙” 。 DeepSearch还会展示它进行搜索时所采取的步骤 。
不仅如此 , Elon强调了Grok 3的创意涌现能力 。 在这个和DeepSeek十分相似的页面上 , Grok新增了第三个标签按钮『Big Brain』 。 使用“大脑模式” , 通过更多计算资源和推理来使用Grok 3 , 也许会呈现意想不到的效果 。
未来Grok 3应该不太限制大模型的创作风格 , 以及思考创意的边界 。 相比之下 , OpenAI则是解除了ChatGPT的成人内容限制 , 这就 。。。。。
03 口水战打不完 , 奥特曼的反击面对Grok 3的突袭 , OpenAI并非毫无动作 。
发布会前天 , 山姆·奥特曼在X平台宣称:“GPT-4.5将带来AGI的初体验 。 ”预计GPT-4.5也会在一两周内发布 , 届时拿出满血的O3 , 应该能夺回全球最佳模型的宝座 。
此前 , 一个由马斯克牵头的财团拟出价 974 亿美元收购 OpenAI , 后者的首席执行官萨姆?阿尔特曼对此回应称 , ” 不用了 , 谢谢 , 但如果你愿意 , 我们可以以 97.4 亿美元的价格收购推特(即如今的 X)”后 。
商业竞争互相都不手软 , 口水战也打个不停 。
未来两家公司还存在路线竞争 。 与OpenAI的闭源策略针锋相对 , Grok 3承诺未来“开源” , Grok 2将在一个月内开源 , 并计划接入特斯拉车载系统和Optimus人形机器人 。
同时 , xAI同步推出了“Super Grok”订阅服务 , 以每月49美元的价格向开发者开放深度搜索(DeepSearch)功能——这种能交叉验证信息来源、公开推理路径的引擎 , 直指ChatGPT的“黑箱”痛点 。
更深层的冲击来自生态层面 。 Grok 3的开源策略吸引了大量开发者涌入 , 而特斯拉的硬件布局(如Model Q车载系统)则为AI落地提供了现实场景 。
2025年 , AI领域的权力天平正在倾斜 。 Grok 3的颠覆性不仅在于技术 , 更在于它重新点燃了“开源理想主义”的火种 。 正如一位硅谷投资人所言:“马斯克用Grok 3完成了一场迟到的复仇 , 但这场战争的真正赢家 , 或许是那些终于看见技术透明曙光的人们 。 ”
山姆·奥特曼会拿出怎样的竞争手段回击呢?
作者丨鲸哥
本文由人人都是产品经理作者【AI鲸选社】 , 微信公众号:【鲸选AI】 , 原创/授权 发布于人人都是产品经理 , 未经许可 , 禁止转载 。
题图来自Unsplash , 基于 CC0 协议 。
推荐阅读
- “豫中一” App 因账号注销问题被责令整改
- iPhone SE 4 被命名为 iPhone 16E 的可能性越来越大
- DeepSeek?已被捕获!紧急提示→
- 华为Pocket 3再次被确认:可旋转外屏+红枫影像,大革新来了
- 被忽视的OPPO续航神机,1200元不到,各方面都足够平衡!
- 中方强烈抗议,DeepSeek已被屏蔽,动手的不是美国,60国签字拍板
- 折叠屏iPhone被确认:采用双屏大折方案,屏幕尺寸也已清晰
- 消息称国产5nm首批产能被华为包下,将用于Mate80系列手机
- 字节被判赔8000万!抖音副总回应
- iQOO Z10系列再次被确认:全高频直屏+独显芯片,暂定4月发布
