1000 亿天价,扎克伯格买下「半个天才」和 Meta AI 的未来

1000 亿天价,扎克伯格买下「半个天才」和 Meta AI 的未来

文章图片


「21 世纪最贵的是什么?人才!」
多年前葛优在《天下无贼》里台词的含金量 , 还在不断提升 。
当地时间 6 月 10 日 , 媒体曝光 Meta 将以 149 亿美元(折合人民币约 1066 亿元)的价格收购 Scale AI 49% 的股权 , 而后者的联合创始人 Alexandr Wang , 将成为 Meta 新成立的「超级智能小组」的掌门 。
按照股权比推算 , 此次交易 Wang 和团队有可能获得 74 亿美元 , 堪称是硅谷成本最高的「挖角」——要知道 , 谷歌在 2014 年收购 DeepMind 团队不过 6 亿美元 。
扎克伯格在内部信中写道:「我们将共同构建 AI 的未来 。 」在 Llama 4 模型折戟、AI 团队人员不断流失的现实下 ,Meta 此次大举押注 Scale AI , 图的是什么?有了 Scale AI 和 Alexandr Wang , Meta 能在接下来的 AI 大战中 , 重新找到自己的位置吗 ?

01最贵的「摇摆人」
作为 AI 时代硅谷蹿升最快的公司 , Scale AI 的估值一直以火箭速度蹿升 , 短短 5 年时间就膨胀至 138 亿美元 。 然而 , 此次 Meta 收购前者 49% 的股权 , 就需要付出 149 亿美元的成本 。
49% 显然是为了反垄断审查考虑 , 但 Meta 和扎克伯格想要的 , 是联合创始人之一 Alexandr Wang 这个人——这位 19 岁创业的天才将成为 Meta 新成立的超级智能实验室的负责人 , 带领 Meta AI 进入新时代 。
有意思的是 , 说 Meta 彻底买下 Wang 并不确切 , 因为 Wang 将继续担任 Scale AI 的 CEO 一职 , 代表 Wang 和 Scale AI 还将继续保持「独立」, 这可能也是历史上成本最高的「脚踏两只船」 , 而 Scale AI 如果保持增长势头 , Wang 则可能成为硅谷身家增长最快的创业者 , 没有之一 。
扎克伯格如此急不可耐地、以 Meta 以罕见的金额出手押注 Scale AI 和 Wang , 体现出的是他因 Meta 在 AI 竞赛中逐渐掉队的焦虑 。
尽管 Meta 在 2024 年推出了参数规模达 1.8 万亿的 Llama 4 Behemoth , 但其在多模态理解、长文本推理等关键指标上仍落后 GPT-4.5 约 12% 。 更尴尬的是 , Llama 训练数据的质量问题被曝光:业内估算约 30% 的语料来自低质量社交媒体内容 , 导致模型频繁输出错误信息 。
刚刚成立 2 年后的 Scale AI 团队 , 最左侧为 Wang 本人|图片来源:Scale AI
「 我们缺的不是算力 , 是干净的数据和顶尖工程人才。 」一位 Meta AI 研究员匿名吐槽 。 这解释了为何扎克伯格要砸重金请来 Wang——一个以数据标注技术闻名的「基建狂魔」 。
作为估值最高的数据标注公司 , Scale AI 的蹿红不是没有道理 。 根据报道 , Scale AI 的护城河在于其将原始数据转化为 AI 可用燃料的能力:
军事级标注精度:通过混合人类标注员+AI 质检的「双保险」 , 其数据错误率仅 0.3% , 而行业平均为 5%(公司自述) 。
多模态数据垄断:拥有全球最大的视频动作标注库(含 1.2 亿条人体动作数据)和跨语言文本数据集(覆盖 217 种语言) 。
而事实上 , 花 149 亿美元巨资买下「半个」Scale AI 和 Wang 本人 , Meta 的野心不仅仅在于 AI 大模型本身 。

02转型 AI 基建 , 弥补 B 端短板
数据、算力和模型 , 是大模型领域的三要素 , Meta 作为社交巨头 , 在数据和算力上有着天然优势 , 不过在「数据」上需要打个引号 , 因为 Meta 的数据量虽然大 , 但如果质量不行 , 对于 AI 模型训练作用不大 。
「 你们看到的每个 GPT 回复 , 背后都有我们标注的 500 个数据点。 」Wang 的这句话 , 解释了 Meta 的焦虑 。 当 OpenAI 用 Scale AI 的数据训练出更聪明的模型时 , Meta 却困在自家社交数据的孤岛里 。 收购 Scale AI , 等于直接接管了竞争对手的「弹药库」 。
Scale AI 手握全球 35% 的 AI 训练数据流量 , 服务着从五角大楼到 OpenAI 的顶级客户 。 Meta 研究院的工程师私下吐槽:「我们用 Llama 3 训练时 , 30% 算力浪费在清洗垃圾数据上 , 而 Scale AI 的标注精度能达到 99.7% 。 」
有了 Scale AI 精准的数据清洗和标注 , 业内估计 Meta 将训练数据污染率从 15% 降至 2% , 下一代 Llama 5 的训练周期缩短 40% 。 知情人士透露 , 正在测试的「Llama 5 Behemoth」参数规模达 3 万亿 , 专门用于攻克 AGI 。
同时 , Scale AI 的标注系统已深度适配 Meta 定制 AI 芯片架构 , 形成「数据标注-模型训练-硬件优化」闭环 , 有可能使 Llama 模型推理成本降低至 GPT-4o 的 1/3 。
可以说 , 引入 Scale AI 后 , Meta 的 Llama 模型从训练质量、效率和成本上都将获得大幅优化 。
事实上 , Scale 的接入 , 甚至可能重塑 Meta 在 AI 竞争中的整个战略 。 相比于 Google 和微软 , 缺少云计算平台的 Meta 一直只能在 C 端撒野 。 而有了 Scale 的能力 ,Meta 计划通过 AWS/Azure 等云平台对外提供 Scale AI 数据服务 , 构建类似微软「Copilot+OpenAI」的生态闭环 , 将竞争对手转化为客户。
如果说数据是新时代的石油 , 那么 Meta 通过购买 Scale AI 这家份额最大的「数据精炼厂」 , 已经掌握了大半个 AI 基建体系 。
Meta 在 AI 竞争中逐渐掉队|图片来源:Meta
当然 , OpenAI、Anthropic 等竞争对手到底会不会买账目前仍未可知 , 虽然 Meta 仅仅买下半个 Scale AI(和半个 Wang) , 但显然已经足够让前者警惕 Scale AI 的中立地位 , 所以 openAI 也在加紧和 Scale AI 的竞争对手 Handshake 合作 。
不过 , 鉴于 Scale AI 在数据标注方面的压倒性优势 , OpenAI 等公司要想马上和 Scale AI 断联 , 也不太现实 。 至少在短期内 , AI 巨头们依然需要 Scale AI 的服务 。
即便 Scale AI 之前的客户们逐渐减少下单 , Meta 和 Scale AI 已经谋划新的收入来源——政府和国防客户 。 根据报道 , Scale AI 合作 , 已经获得来自美军方超过 2 亿美元的政府订单 。 同时 , Scale AI 本身也在向国防定制等垂直领域的 AI 应用层扩展 , 而 Meta 的企业级销售能力和背书 , 无疑会对 Scale AI 未来的发展提供足够动力 。
业内人士传言 , Meta 和 Scale AI 的巨额交易还有一个隐藏对赌:若 Scale AI 未来三年收入增速低于 80% , Meta 有权以折扣价收购剩余股份 ——这代表 Wang 不仅要「让 Meta AI 再次伟大」 , 同时自己的 Scale AI 在收入上也要继续高速增长 。 而 B 端业务显然会成为双方的新增速来源 。
对于 Meta 团队 , Wang 即便作为「脚踏两只船」的超级智能实验室负责人加入 , 也能产生极强的「鲶鱼效应」 。 在硅谷 AI 界 , Meta 向来以学术氛围浓厚著称 , Llama 的开源和普惠正是其学术思考的结果 。 但 Wang 极力推崇的「数据思维」无疑将对 Meta 现有的 AI 团队产生冲击和改变 。
根据媒体报道 , Wang 刚刚加入 Meta , 反手就砍掉三个学术项目 , 推动团队向更「现实」的方向转型 。
如果不考虑反垄断的阻挠 , 此次 Meta 对于 Scale AI 和 Wang 本人的巨额押注 , 可能重塑 Meta 在激烈的 AI 竞争中的角色和发展方向 , 不仅让 Meta 快速缩短和竞争对手在模型领域的差距 , 更能使这个社交巨头 , 完成从应用到 AI 基建角色的转变 。
【1000 亿天价,扎克伯格买下「半个天才」和 Meta AI 的未来】这场豪赌的本质 , 是 Meta 试图用资本力量重写 AI 竞争规则 。 正如硅谷分析师 Sarah Guo 所言:「当所有人都在造车时 , Meta 买下了整条高速公路——不管车上坐的是谁 , 都得交过路费 。 」

    推荐阅读