
文章图片

9月18日 , 上海举行的华为全联接大会(HC大会)上 , 华为轮值董事长徐直军一上台 , 就提起了年初由DeepSeek引起的这场全民狂欢 。
“从今年春节开始到4月30日 , 经过多团队的协同作战 , 终于使昇腾(Ascend )910B/910C的推理能力达成了客户的基本需求 。 ”徐直军说到 , DeepSeek横空出世吼 , 一时间众多政府机构、央企响应接入DeepSeek , 作为算力提供商 , 华为也必须跟进响应 。
华为自2018年首次发布昇腾310芯片、2019年推出昇腾910芯片以来 , 持续投入AI基础算力的研发与创新 。 虽然DeepSeek开创的模式大幅减少了算力需求 , 但徐直军认为 , 要走向AGI和物理AI , 华为认为 , 算力 , 过去是、未来也将继续是人工智能的关键 。
1、华为发布多款芯片产品 , 规划已经设到了2028年徐直军宣布 , 面向未来 , 华为已规划三个系列的昇腾芯片 , 包括950、960和970系列 。
其中 , 昇腾950系列包含两颗芯片:950PR和950DT , 950PR将于2026年一季度上市 , 950DT将于2026年四季度上市 。
昇腾960芯片将于2027年四季度上市 , 昇腾970芯片则预计是2028年四季度上市 。
华为昇腾芯片发布规划;图片由作者拍摄
与上一代相比 , 昇腾950在多个方面实现根本性技术提升:新增支持FP8/MXFP8/HIF8、MXFP4等低精度数据格式 , 算力分别达到1 PFLOPS和2 PFLOPS , 大幅提升训练与推理效率;大幅提升向量算力 , 支持更精细粒度内存访问;互联带宽提升2.5倍 , 达到2TB/s;并搭载自研HBM技术HIBL1.0和HIZQ2.0 。
在通算领域 , 华为规划了鲲鹏950与鲲鹏960 , 分别将于2026年第四季度和2028年第一季度上市 , 围绕支持超节点和更多核、更高性能持续演进 。
此外 , 华为正式发布了面向超节点的互联协议——灵衢 , 并开放灵衢2.0技术规范 。 自2019年开始研究 , 灵衢1.0已开启商用验证 , 如今灵衢2.0的开放 , 旨在邀请产业界基于灵衢研发相关产品和部件 , 共建灵衢开放生态 。
2、发布全球最强算力超节点由于国际政治等复杂原因 , 徐直军也在发布会上直言 , 华为单片芯片的算力表现比不过英伟达 , “但华为有三十年在连接技术的积累 , 华为的超节点计算机 , 能做到世界上算力最强 , 满足全世界在AI训练推理上的巨大需求 。 ”
超节点(SuperPod)是眼下是智算发展的重要趋势 。 徐直军认为 , 超节点在物理上由多台机器组成 , 但逻辑上以一台机器学习、思考、推理 。
【华为和DeepSeek手拉手迈出一大步】在具体的超节点业务进展上 , 华为发布了Atlas 950 SuperPoD和Atlas 960 SuperPoD 。 其中基于昇腾950芯片的Atlas 950超节点支持8192卡规模 , 由128个计算柜和32个互联柜组成 , 占地面积约1000平方米 , FP8算力达8EFlops , FP4算力达16EFlops , 互联带宽高达16 PB , 相当于当前全球互联网总带宽的10倍以上 。
华为发布了Atlas 950 SuperPoD展示;图片由作者拍摄
昇腾950超节点将于2026年第四季度上市 , 徐直军强调 , Atlas 950超节点将是2026~2028年间全球算力最强的AI超节点 。
而另外的Atlas 960超节点 , 支持15488卡 , 由176个计算柜和44个互联柜组成 , 算力、内存和带宽在Atlas 950基础上再度翻番 , 计划于2027年四季度上市 。
徐直军特别提到 , 超节点的价值不仅限于制造、通信和计算等传统业务领域 。 在互联网产业广泛应用的推荐系统方面也有重要作用 。 华为基于泰山950和Atlas 950可构建混合超节点 , 为下一代深度推荐系统开创全新的架构方向 。
不过 , 大规模超节点虽然将智能计算和通用计算能力大大提升 , 但其中的互联技术仍有不成熟的地方 。
例如 , 如何实现8192卡乃至15488卡规模的可靠互联 , 就是行业亟待解决的技术难题 。 目前产业界许多已发布的超节点方案未能实现大规模部署 , 其核心瓶颈并非芯片本身 , 而是互联技术尚未成熟 , 具体体现是两方面的挑战:
一是如何做到长距离而且高可靠 。 大规模超节点机柜多 , 柜间联接距离长达1000至2000米 。 当前电互联技术在高速信号传输时距离受限 , 最多仅支持两个机柜互联;而光互联技术虽能满足长距离连接需求 , 却无法达到单一计算机系统所要求的高可靠性 。
二是如何实现超大带宽与超低时延 。 当前跨机柜卡间互联带宽与超节点需求存在5倍以上差距 , 时延最好仅能达到3微秒左右 , 与Atlas 950/960设计目标仍有24%的差距 。 在时延已逼近物理极限的情况下 , 每0.1微秒的提升都极具挑战 。
徐直军阐述了两方面的解决途径 。
华为在超节点层面的技术积累;图片由作者拍摄
首先 , 为了解决长距离且高可靠问题 , 华为在互联协议的物理层、数据链路层、网络层、传输层等每一层都引入了高可靠机制;同时在光路引入了百纳秒级故障检测和保护切换 , 当出现光模块闪断或故障时 , 让应用无感;并且 , 华为重新定义和设计了光器件、光模块和互联芯片 。 这些创新和设计让光互联的可靠性提升100倍 , 且互联距离超过200米 , 实现了电的可靠和光的距离 。
其次 , 为了解决大带宽且低时延问题 , 华为突破了多端口聚合与高密封装技术 , 以及平等架构和统一协议 , 实现了TB级的超大带宽 , 2.1微秒的超低时延 。
“正是因为一系列系统性、原创性的技术创新 , 我们才攻克了超节点互联技术 , 满足了高可靠、全光互联、高带宽、低时延的互联要求 , 让大规模超节点成为了可能 。 ”徐直军说到 。
推荐阅读
- 华为Mate X7再次被确认:宽屏比例+麒麟9030,折叠Pad也在测试了
- 正面互殴?苹果iPhone 17系列价格破发,华为主力机最高降价2000元
- 华为发布全球最强算力超节点和集群,算力规模达百万卡
- 低调的阿里AI芯片曝光:不输英伟达H20,能PK华为昇腾?
- 多芯齐发,全程高能!徐直军在华为全联接大会2025上的演讲(附全文)
- DeepSeek首次回应“蒸馏OpenAI”质疑 相关论文登上《自然》封面
- 华为宣布,这些新机开启降价
- 华为鲲鹏处理器路线图公布:鲲鹏960将拥有256核心521线程
- 美国PC之王,在中国撑不住了,已不是华为对手
- 梁文锋在《自然》发表封面论文,DeepSeek成首个严格学术审查大模型
