
文章图片

【英伟达下一代AI服务器平台GB300量产进行中】本文由半导体产业纵横(ID:ICVIEWS)综合
ODM们准备好了 。
2025年3月的英伟达 GTC大会上 , 英伟达首次公开了GB300的架构和产品 , 宣布计划于2025年第二季度开始工程样品出货和小量测试订单 , 并计划于2025年第三季度实现量产和首批出货 。
英伟达 GB300 NVL72 采用全液冷机架式设计 , 将 72 个Blackwell Ultra GPU 和 36 个基于 Arm架构 的 Grace CPU整合到一个平台上 , 并针对测试时间扩展推理进行了优化 。 采用 GB300 NVL72 的AI 工厂使用Quantum-X800 InfiniBand 或 Spectrum-X 以太网 , 搭配 ConnectX-8 SuperNICS , 相比NVIDIA Hopper? 平台可将推理模型推理的输出提升 50 倍 。
GB300 NVL72 平台带来的全新 AI 推理性能 。 与 Hopper 相比 , GB300 NVL72 的用户响应速度提升了 10 倍 , 吞吐量(每兆瓦 TPS)提升了 5 倍 。
由于发布会当时GB200系列尚未实现量产 , 有人担心此举会不会造成市场蚕食或推迟GB300的出货 。 同时 , 由于制造工艺技术、液冷系统和热管理等关键挑战 , GB200 产品的量产时间从 2024 年 9 月推迟到 2025 年第二季度 。 许多供应商随后预计 , GB300 也可能因此面临延迟 。
2025年4月 , 有报道称 , GB300最初计划采用的Cordelia架构将被GB200现有的Bianca架构取代 。 这一变化增强了业内人士对GB300计划在2025年第四季度批量出货的信心 。
近日 , 据供应链消息人士透露 , 英伟达已开始限量生产其下一代人工智能服务器平台GB300 , 预计将于 2025 年 9 月开始批量出货 。 业内人士预计 , 得益于减轻制造商负担的战略转变 , 英伟达下半年的生产轨迹将平稳 。
英伟达的一项重要举措是 , 选择在GB300 上沿用其当前 GB200 平台(即 Bianca 主板)的主板设计 。 这种重复使用大大缩短了供应商的学习曲线 , 过去许多供应商都难以跟上英伟达迅猛的产品更新周期 。
一位ODM代表表示:“目前GB300没有出现什么大问题 。 下半年的出货应该会很顺利 。 ”
目前 , GB200 的需求依然强劲 , 尽管其对液体冷却的依赖导致了大量冷却剂泄漏的报道 。 尽管问题尚未解决 , 但企业客户仍然渴望部署该系统 , 并选择了泄漏测试和局部停机等临时解决方案 。 在人工智能开发中保持竞争力的紧迫性促使数据中心运营商优先考虑速度而非技术完善 。
一位业内高管表示:“英伟达在AI服务器领域的升级步伐就像军事闪电战 。 竞争对手甚至连尾灯都看不到 , 但供应链却感受到了压力 。 ”
英伟达的快速迭代——从 Hopper 到当前的 Blackwell 架构——持续带来翻天覆地的变化 。 例如 , GB200 大幅压缩了服务器布局 , 导致量产屡屡延期 。 然而 , 由于 GB300 可重复利用现有基础设施 , 供应商不再面临同样严峻的产能提升挑战 。
ODM厂商目前正在积极测试GB300 , 早期生产结果令人鼓舞 。 预计过渡将顺利进行 , 预计第三季度出货量将保持稳定 , 第四季度出货量预计将进一步回升 。 计算板供应商纬创资通已确认 , 由于代际重叠 , 本季度收入将不会环比增长——这间接证实了GB300的生产正在进行中 。
展望未来:Rubin系列将带来新的挑战虽然供应链暂时得到缓解 , 但下一个架构飞跃的准备工作已在进行中:英伟达的Rubin平台 。
2025年6月 , 德国莱布尼茨超算中心确认全新超级计算机 Blue Lion , 将在 NVIDIA Vera Rubin 架构上运行 。 在推理性能方面 , Rubin实现了惊人的50 petaflops , 是当前Blackwell芯片的2.5倍 。 据报道 , SK 海力士在尚未进入量产阶段的情况下就向英伟达少量供应了用于下代 Rubin GPU 样品的 HBM4 12Hi 内存堆栈 。
Rubin将引入与台积电合作设计的基于 chiplet 的 GPU , 并采用全新设计的 Kyber 机架 (VR300 NVL 576) , 取代目前的 Oberon 机架 。 新的设计将提升GPU密度 , 从而需要更强大的散热解决方案 。 液冷技术在GB200中已得到更显著的应用 , 而Rubin也将因此成为核心 。
目前 , GB200 液冷系统中最脆弱的部件是快速连接配件 , 即使在工厂进行压力测试后 , 也容易发生泄漏 。 ODM指出 , 实际部署场景的水压和管道设计差异很大 , 因此很难完全消除泄漏 。 发货后的维护工作耗费了大量人力 。
尽管面临这些挑战 , ODM厂商仍然对GB300的推出充满信心 。
客户端对AI服务器的需求依然强劲 , 厂商加班加点地支持客户交付 。 富士康、纬创、广达等GB200出货量主要龙头企业及其相关供应链预计将继续受益于市场对AI算力日益增长的需求 , 预计2025年下半年营收将实现增长 。
*声明:本文系原作者创作 。 文章内容系其个人观点 , 我方转载仅为分享与讨论 , 不代表我方赞成或认同 , 如有异议 , 请联系后台 。
想要获取半导体产业的前沿洞见、技术速递、趋势解析 , 关注我们!
推荐阅读
- 曝英伟达H20供应有限,且不打算重启生产
- 外媒:华为、英伟达领跑AI后端交换机市场!
- 英伟达H20解禁,会有人买么?华为芯片,已是其10倍性能了
- 库克放弃高利润!A18 Pro+钛合金+5倍光学变焦,降幅高达2500元
- 双筒、三筒洗衣机爆卖:占比已达10% 一个月翻2倍
- 不再死记IP,告别端口地狱,Dockpeek让你一键直达Docker服务
- 台积电2nm加成:AMD Zen 6处理器已达6.4GHz,将冲击7GHz
- ARM、X86的天塌了?英伟达宣布:CUDA支持RISC-V
- 英伟达H20解禁,台积电笑了,但国产GPU厂商笑不出来
- 荣耀彻底清仓!16GB+512GB+3D解锁+卫星通信,降幅高达2700元
