英伟达“丢掉”的1000亿,国产平替还能继续赚吗?

英伟达“丢掉”的1000亿,国产平替还能继续赚吗?

文章图片


“我们可能无法全部恢复先前的库存减计损失 , 但大多数库存是可以恢复的 。 新的客户需求和我们现有的库存产品是可以匹配的 , 所以不能说100%恢复 , 但也不是完全没有可能 。 ”
这是英伟达创始人黄仁勋对H20芯片解禁后的最新表态 。 他在链博会上的上述讲话 , 无疑给了英伟达国产平替们一记闷棍 。
此前 , 在2025年一季度财报电话会上 , 黄仁勋对外提到 , 因中国芯片出口限制带来的计提损失一季度55亿美元 , 二季度有望升至80亿美元 , 总损失达到近1000亿元人民币 。
作为对比 , 2024年 , 英伟达在中国交付了超过100万张H20芯片 。 按照彼时单芯片1.2万美元到1.3万美元的售价计算 , 仅H20就为英伟达贡献了超过120亿美元的营收 , 超过上一财年英伟达中国区的整体营收 。
近千亿的潜在亏损 , 直接影响着英伟达在中国芯片江湖的市场地位 。 5月份参加Computex 2025期间 , 黄仁勋对外表示英伟达在中国AI芯片的份额已经从2022年出口管制期间的95% , 下降至50% 。 伴随而来的 , 则是英伟达在中国的市场的营收占比从2022年的约40% , 下降到不到20% 。
国产芯片厂商们 , 成了英伟达中国市场份额下滑中的最大赢家 。 以DeepSeek R1为代表的推理模型的到来 , 更是为国产芯片瓜分英伟达平添了一份助力 。
2025年前 , 大模型行业更多处在预训练阶段 , 一众国产芯片厂商都难以在训练效率和结果上匹敌英伟达芯片 。 但进入后训练阶段的推理模式后 , 调用大模型过程中 , 随着客户对芯片性能的要求直线下降 , 落后英伟达好几代的国产芯片厂商们 , 终于等来一次难得的平替机会 。
据字母榜(ID:wujicaijing)了解 , 华为在昇腾芯片加持下 , 一度在今年一季度的DeepSeek一体机市场 , 占据了超70%的份额 。
寒武纪更是凭借飙涨的订单量 , 罕见地完成了扭亏为盈 。 沐曦股份和摩尔线程等初创芯片公司 , 更是在蜂拥订单助力下 , 纷纷开启了上市冲刺 。
但H20芯片解禁消息一出 , 处在加速度中的国产芯片厂商 , 不可避免将迎来新一轮业务震荡期 。

A除了抢占以DeepSeek一体机为代表的推理市场 , 华为还瞄准了英伟达占据核心的训练市场 , 发起进攻 。
在单卡性能不如英伟达的显示前提下 , 华为采取了以量取胜的笨办法 , 借助比英伟达更多的多卡集群来补上差距 。
4月份 , 华为对外推出CloudMatrix 384超节点 , 官方称其已在芜湖数据中心规模上线 。 据“科创板日报”报道 , 华为内部人士称其为核弹级的产品 , 或将彻底终结算力焦虑 。
传统AI服务器通常包括8张算力卡 , 一台服务器称为一个节点 。 在ChatGPT掀起大模型浪潮 , 并验证了缩放法则(Scaling Law)的正确性后 , 更大的算力集群 , 便成了训练出更优模型的必备条件 。
为此 , AI厂商不得不构建起包括成千上万张GPU算力卡的算力集群 , 这便带来了卡与卡之间互联和通信的新麻烦 。
针对上述难题 , 2024年3月 , 英伟达率先发布了NVL72超节点 , 支持把72张算力卡组成一个超节点 , 为万亿参数的大模型训练和推理提供服务 。
作为对比 , 华为CloudMatrix 384顾名思义便是以384张昇腾算力卡组成一个超节点 , 从而在规模、性能和可靠性上对标英伟达的NVL72 。
华为的野心时刻被黄仁勋看在眼中 。 在谈及国产芯片竞争时 , 黄仁勋再度提及华为 , “任何低估华为、低估中国制造能力的人 , 都是极其天真无知的 。 华为是一家非常强大的公司 , 我以前见过他们开发出的技术……他们能够做到和我们接近 , 这说明了一切 。 ”
华为之外 , 作为当前GPU芯片上市第一股的寒武纪 , 则用更直观的财报数据 , 向外界展示了是如何瓜分英伟达蛋糕的 。
2025年一季度 , 寒武纪实现营业收入11.11亿元 , 同比暴涨4230.22% , 接近去年全年营收 。 归属于上市公司股东的净利润3.55亿元 , 上年同期为亏损2.27亿元 , 实现历史性的扭亏为盈 。 这也是寒武纪连续第二季度实现盈利 , 去年第四季度寒武纪归母净利约为2.81亿元 。
更多创业公司也在暴涨订单助力之下 , 开始抢夺上市窗口期 , 包括沐曦股份和摩尔线程在内 , 都于年内提交了IPO申请 。

B但在国产芯片厂商纷纷争当英伟达平替的另一面 , 则是他们受限于产能等因素 , 还无法把到手的订单全部消化 。
以寒武纪为例 , 尽管其一季度营收暴涨超40倍 , 但绝对值上也只有约11亿元人民币 , 相比英伟达一季度55亿美元的计提损失 , 占比不到3% 。
就在国产芯片还在等待产能提升的当下 , 英伟达H20芯片值此解除禁售 , 等于反过来又抢了一波国产芯片的空窗期 。 这一变动 , 将直接影响三季度后的国产芯片厂商整体营收规模 , 也将抢占国产芯片原本就不大的市场空间 。
年初DeepSeek爆火带动一众科技大厂加码To C应用时 , 尤其是腾讯元宝因接入DeepSeek流量暴涨 , 有报道称腾讯、字节等向英伟达紧急下单了一批H20芯片 , 以满足AI应用的算力消耗 。
但随着4月份H20被禁 , 上述订单也不了了之 。 近期H20解禁后 , 外界很快传出字节、腾讯等厂商已经向英伟达下单 。 对此 , 黄仁勋否认称 , 自己还没来得及与任何客户会面 。 “需要一些时间来提升H20供应链的产能 , 未来几个月 , 英伟达将努力加速这一过程 。 ”
之所以仍有一众厂商愿意等待英伟达H20芯片 , 关键原因之一在于 , 英伟达芯片在多卡串联的并行计算环节 , 仍然存在较大优势 。
微软大中华区Azure事业部总经理陶然便曾对外解释道 , 很多厂商没有能力去实现多卡连接 , 但多卡并行运算却直接决定着大模型训练所需花费的时间成本 , “同样的一套模型 , 如果训练一次需要花费一周成本为100万美元 , 但如果带宽太小最终耗时两周 , 那成本就将乘以2 。 ”
在崇尚效率的大模型赛道 , 时间有时比金钱更重要 。 更糟糕的是 , 即便是在更换国产GPU的过程中 , 国内AI厂商眼下也面临无法使用更先进制程工艺芯片的挑战 。 美国相关部门已经将壁仞、摩尔线程等国产GPU公司列入实体清单 , 这意味着在没有获得许可的情况下 , 它们既不能进口含有美国公司的任何技术或产品 , 也不能通过台积电等代工厂生产14nm以下的先进芯片 。
对国产芯片厂商来说 , 算得上好消息的一点是 , 从2022年开始的英伟达芯片禁令 , 把控方向正变得越来越严格 , 且政策还往往易变 。 即便H20芯片解禁 , 从供应链稳定和安全的角度考量 , 部分AI厂商也需要这些国产芯片厂商继续供货 。

C英伟达的麻烦并未随着H20的解禁而告一段落 。 相比上半年近千亿的损失 , 更令英伟达担忧的 , 则是大客户纷纷自研芯片的现状 。 这一景象已经在美国陆续发生 。
为了降低用云成本 , 微软、谷歌等美国头部云厂商开始加速自研服务器芯片和云端AI芯片 。
“如果你能制造出针对AI进行优化的硅 , 那前方等待你的将是巨大的胜利 。 ”研究公司Forrester分析师格伦·奥唐纳形容道 。
谷歌曾是最早大规模采购GPU来进行AI计算的公司 , 但后来研发自己的AI专用芯片 , 在2016年就已经发布了第一代TPU(张量处理单元) 。 如今 , 从AI绘图公司Midjourney , 到AI独角兽公司Anthropic , 都开始使用起了谷歌的算力 。
亚马逊也借助2015年收购的以色列芯片初创公司Annapurna Labs , 在2018年前后推出了基于Arm的服务器芯片和AI芯片 , 并开始将自研算力服务器兜售给包括OpenAI、Anthropic等在内的AI大客户 , 从而挤占英伟达的市场份额 。
就连一贯英伟达强绑定的OpenAI , 也在内部筹划着自研芯片的事情 。 至少从2022年开始 , OpenAI就已经讨论了各种方案 , 希望能解决芯片又贵又短缺的问题 , 自研芯片便是方案之一 。
对需求量大的国内科技大厂而言 , 成本压力也是华为、阿里、百度、字节、腾讯等自研芯片的原因之一 。 国信证券在一份研报中称 , 处理器芯片占服务器BOM(物料清单)成本约40% 。
在阿里、百度相继推出各自的平头哥和昆仑芯计划之后 , 2021年3月 , 媒体曝出字节跳动正在自主研发云端AI芯片和Arm服务器芯片 。 字节跳动随后证实 , 正在组建芯片团队 。
几乎在同一时间 , 腾讯也被曝出多个芯片研发岗位的招聘信息 。 官方随后回应 , 腾讯正在研发的并非通用芯片 , 而是基于一些业务需要 , 在特定领域展开的协处理器研发尝试 , 比如AI加速和视频编解码等 。
类比当前智能手机领域的芯片竞争格局 , 展望未来的AI芯片领域 , 未必不会达成部分复杂场景用英伟达芯片 , 部分简单场景用自研和国产芯片的混合计算架构局面 。
【英伟达“丢掉”的1000亿,国产平替还能继续赚吗?】但想要维持上述局面的一大前提是 , 黄仁勋得避免让英伟达芯片再度迎来出口禁令 。

    推荐阅读