大模型竞争:美国抢人,中国裁人

大模型竞争:美国抢人,中国裁人

文章图片


在大模型竞赛中处于下风的厂商 , 纷纷对自家AI团队动起了刀 。
一直被外界诟病在AI上落后好几步的苹果 , 最近也有了些稍微振奋人心的好消息:除了苹果AI与机器学习战略高级副总裁约翰·詹南德雷亚被爆淡出苹果公司核心管理层 , 遭遇降职处理外 , 还传来苹果有望收购明星AI搜索创企Perplexity的消息 , 希望借此来补强苹果在AI领域的人才和技术储备 。
以5月份Perplexity完成新一轮融资后的140亿美元估值计算 , 一旦收购成功 , 这将成为苹果史上最大的一笔并购案 , 超过2014年以30亿美元收购Beats的交易纪录 。
苹果的人才收购计划尚悬在空中 , 另一边作为Meta创始人的马克·扎克伯格已经拿出143亿美元的真金白银 , 打算将Scale AI联合创始人兼CEO Alexandr Wang收归麾下了 。
4月份Meta新一代开源模型Llama 4不及预期的外界表现 , 让扎克伯格有了重组AI团队的想法 , 并开始付诸行动 , 在内部搞起了一个全新的超级智能团队 , 计划交由Alexandr Wang领导 。
除了豪掷千金挖来Alexandr Wang外 , 扎克伯格被爆还在接触前OpenAI首席科学家伊利亚·苏茨克弗初创公司SSI(Safe Superintelligence)的CEO——丹尼尔·格罗斯 , 以及前GitHub CEO纳特·弗里德曼 。
几乎在扎克伯格忙着行业大牛的同一时期 , 谷歌也被爆料将任命DeepMind CTO科拉伊·卡武克奥卢担任谷歌首席AI架构师 , 负责统筹未来AI产品开发 , 直接向CEO桑达尔·皮查伊汇报 。
上述人事变动 , 成了谷歌重组其Gemini应用团队 , 以加快追赶OpenAI步伐的新举措 。
不同于扎克伯格担心Llama会在模型性能上落后OpenAI , 谷歌凭借Gemini系列模型更新逐渐逼近OpenAI之际 , 却愈发意识到自家产品跟ChatGPT之间存在的用户规模鸿沟 。 如何补上产品滞后的短板 , 成了谷歌的当务之急 。
陷入调整动荡期的 , 不只有国外大模型厂商 。 国内被DeepSeek冲击的AI六小龙们 , 更是无一例外进入了密集的高管离职潮 。
值得注意的是 , 相比苹果、Meta等重金抢人的追赶手段 , 六小龙们却几乎都选择了裁员以收紧资源分配的追赶策略 。
去年还高举高打模型和应用双轮驱动的六小龙们 , 在新的大模型竞争周期中 , 不得不重新将技术迭代确立为公司的最高优先级 。
策略转变之下 , 一批负责应用和商业化的高管相继离开 , 包括但不限于前智谱COO张帆、前MiniMax商业化负责人魏伟、前月之暗面核心产品负责人明超平、前阶跃星辰“冒泡鸭”产品负责人张心皓(尚未离职 , 转为内部顾问)……
无论借助重金挖人补强自身短板 , 还是通过裁员精简组织 , 都成了中美大模型厂商努力将自己留在AGI牌桌上的新筹码 。

A扎克伯格再一次找回了当年创办Facebook(Meta前身)时的状态 , 开始化身公司头号HR 。
频繁接触AI研究人员 , 试图把他们挖到Meta之外 , 扎克伯格还亲手组建一个全新的AI实验室 , 被其视为大规模重组Meta AI业务的一部分 。 该实验室预计规模在50人 。
现在 , 借助对Alexandr Wang的收购 , 上述AI实验室的主管人选已经到位 。
外媒The Information爆料称 , 早在4月中旬 , 扎克伯格就与Alexandr Wang进行了接触 , 希望王能够加入Meta , 并愿意支付数十亿美元来实现这一目标 。
但Alexandr Wang不满足于扎克伯格的报价 , 一度将自身和身后Scale AI的报价提高至200亿美元 。 在接下来一个多月的谈判中 , 双方互相做了些让步 , 并有了Meta最终以143亿美元收购Scale AI 49%股份 , 且Alexandr Wang需要加入Meta的方案出炉 。
为了防止Alexandr Wang中途离职 , Meta在收购条款中特意注明 , Alexandr Wang需要在Meta工作五年以上 , 才能拿到绝大部分收购现金 。
Alexandr Wang之外 , 扎克伯格的还在继续 。 据CNBC报道 , 扎克伯格一度还试图收购前OpenAI联合创始人、首席科学家伊利亚创办的AI初创公司SSI 。
根据4月份SSI完成20亿美元融资后的最新估值计算 , 扎克伯格或许将要为这笔收购付出320亿美元的代价 。
不过 , 伊利亚拒绝了扎克伯格的高薪诱惑 。 遭遇闭门羹后的扎克伯格 , 直接掉转船头 , 将挖角对象换成了SSI的现任CEO格罗斯 。
截至目前 , 扎克伯格对格罗斯和弗里德曼的 , 还在进一步谈判中 。
不同于扎克伯格砸钱抢人的行为 , 国内六小龙们 , 则上演着另一番组织调整景象 , 即不仅不从外部挖人 , 反而动手裁减起好不容易而来的核心高管 , 从智谱到月之暗面、阶跃星辰、MiniMax、百川智能和零一万物 , 从去年下半年开始 , 均有多位高管离开公司 。
据字母榜了解 , 这些离职高管多集中在应用和商业化领域 。
最新调离核心岗位的是阶跃星辰产品负责人张心皓 。 6月初 , 据《智能涌现》爆料 , 去年12月 , 阶跃星辰旗下角色扮演类应用“冒泡鸭”停止大范围投入 , 团队被合并至AI助手类应用“跃问”(现更名为“阶跃AI”) 。
字母榜获悉 , 作为“冒泡鸭”产品负责人的张心皓 , 当前在公司内部的角色已变更为顾问一职 。
尽管尚未彻底离职 , 但顾问角色更多代表一种虚职 。 此前以类似方式完成变相离职的 , 还有前MiniMax产品负责人张前川 。 去年9月 , 张前川被爆离职 , 随后官方在对外回应中便表示 , 张前川因个人原因淡出公司事务 , 改任产品顾问一职 。
几乎与张前川改任顾问同一时期 , 前字节剪映产品经理、月之暗面核心产品负责人明超平 , 也正式从月之暗面离职 , 开始下场创业 。
从去年12月至今 , 包括百川智能联合创始人、商业化负责人洪涛 , MiniMax商业化合伙人兼副总裁魏伟 , 智谱COO张帆等帮助公司开拓商业收入的一批高管 , 均相继离开 。

B导致中美大模型厂商集体进入动荡期的核心原因之一 , 是这些玩家在新一轮竞争中 , 都暂时落在了下风 , 不得不通过新的组织调整来追赶先行者的步伐 。
推动扎克伯格重组Meta AI团队 , 重金Alexandr Wang的一大信念 , 即Meta在人工智能竞赛中已经落后 。
2023年初 Llama 1发布之后 , Meta一跃成了大模型开源之王 。 在OpenAI抢占先机的前提下 , 扎克伯格借助开源 , 为Meta在大模型竞争中抢到了一张船票 。
但如今 , 这张船票有了丢失的可能性 。 4月初 , Llama 4一经发布便遭遇大面积负面评价 , 堪称今年AI界最大“翻车”事件 。 Llama 4不仅被爆用特调版本刷榜 , 还被爆做了数据过拟合测试 , 即将各个benchmark的测试集混合在post-training(后训练)过程中 , 目的是希望能够在各项指标上拿到一个好成绩 。
尽管Llama技术人员出面否认了数据过拟合造假传闻 , 但使用特调版本却是不争的事实 。
早在1月份DeepSeek R1出圈爆火后 , Meta内部就曾被曝出开始担心起还未发布的Llama 4在性能上可能无法赶上DeepSeek R1 。
彼时 , 有Meta员工在硅谷匿名八卦分享平台Blind上发布消息称 , Meta的生成式AI部门正因DeepSeek处于恐慌中 , 甚至爆料称尚未发布的新一代开源模型Llama 4 , 在基准测试中已经落后于DeepSeek 。
相比起扎克伯格因担忧模型落后而展开的疯狂抢人之举 , 谷歌尽管靠着Gemini 2.5系列在模型性能上几乎追平了OpenAI , 但谷歌也有着自己的新挑战 , 即产品实在落后ChatGPT太多 。
根据谷歌流传出的一份内部报告 , 截至2025年3月 , Gemini全球日活跃用户3500万 , 月活跃用户3.5亿 。 作为对比 , ChatGPT的日活跃用户为1.6亿 , 月活跃用户为6亿 。
OpenAI CEO山姆·奥特曼更是将“ChatGPT取代搜索”的论调 , 走到哪说到哪 , “大家把 ChatGPT当成是Google的替代品 。 ”
相比模型能力的高低 , 以应用起家的谷歌 , 无疑更在意这场AI时代“注意力资源”比拼之战的胜败 。
同样被DeepSeek冲击到的国内六小龙 , 则如同Meta的Llama一般 , 陷入了新一轮技术自证的危机之中 。
且比Llama更糟糕的是 , 扎克伯格还有着Meta源源不断的雄厚财力支持 , 而从2024年下半年开始 , 急剧恶化的融资环境 , 正使得六小龙的技术追赶之路横生变故:零一万物明确放弃AGI , 百川智能转向医疗垂类场景 。
坚持模型和应用双轮驱动的四小强玩家 , 也几乎同时放弃了进一步做大应用规模的野心 , 开始将有限资源押注到模型迭代上 。
值此背景之下 , 裁减负责产品应用和商业化推广的核心高管 , 也就成了摆在六小龙面前的一道必选题 。

C一个砸钱抢人 , 一个裁员节流 , 背后则反映出了当下两种不同的大模型追赶策略:
财大气粗的大厂 , 可以用金钱换时间 , 实现效率最大化;
资金捉襟见肘的创业公司 , 只能收缩有限资源 , 实现价值最大化 。
在用金钱换时间上 , 国内字节等大厂已经率先给Meta做了表率 。 同样靠着砸钱抢人的手段 , 张一鸣带领字节AI团队 , 从2023年的落后生 , 经过一年发展 , 一跃在2024年底成了国内第一阵容玩家 。
如何在有限资源内做出媲美行业头部的模型性能 , 这方面国内的DeepSeek同样率先做出了表率 。 借助一系列工程创新 , 梁文锋以不足OpenAI o1十分之一的资金成本 , 自研出了性能足以媲美o1的R1 。
无论是字节的后来居上 , 还是DeepSeek的异军突起 , 支撑他们跻身大模型行业头部地位的 , 除了舍得花钱抢人之外 , 更重要的是 , 它们都明确对外展现出了追求AGI的雄心和抱负 , “这(远大前景)才是更吸引顶尖人才的东西 。 ”有AI领域在读博士向字母榜解释道 。
毕竟 , 在高度人才密集的大模型行业 , 如何获取并吸引到源源不断的年轻人才加入 , 才是能否到达AGI的最终之路 。
面对扎克伯格的疯狂抢人 , 近期奥特曼就回应道 , 自己听说Meta把OpenAI视为他们最大的竞争对手 。 “我觉得他们继续努力是理性的选择 , 虽然他们目前的AI进展可能没有达到预期 。 我尊重他们这种有侵略性的态度 , 以及不断尝试新方法的精神 。 ”
但话锋一转 , 奥特曼就颇为自豪地反击道 , 尽管扎克伯格开始向OpenAI团队中的一些人开出高达1亿美元的签约奖金 , “但我真的很开心的是 , 到目前为止 , 我们最优秀的那些人都没有接受他们的邀约 。 ”
奥特曼给出的原因之一便是 , 这些人才在比较OpenAI和Meta这两条路时 , 会认为OpenAI 在实现超级智能上有更大的可能性 。
对AGI宏大目标的坚定追求 , 也是梁文锋在跟大厂争抢人才时的一大底气 。 在被问到“怎么确保DeepSeek就是做大模型的人的首?。 俊笔?, 梁文锋给出的回答是:“因为我们在做最难的事 。 对顶级人才吸引最大的 , 肯定是去解决世界上最难的问题 。 ”
【大模型竞争:美国抢人,中国裁人】从OpenAI到DeepSeek , 它们的接连成功 , 起码向外界透露了一种信号:想要在大模型时代有所创新 , 光靠砸钱是不够的 , 更重要的是得让人才有一展抱负的空间 。

    推荐阅读