
文章图片
【NVIDIA发布LLM专用GPU:3倍注意力提升,26年发布】
NVIDIA已经在GTC 2025上公布了下一代Rubin GPU的部分消息 , 不过现在看起来AI实在是太过于火爆 , 导致NVIDIA即使没有正式发布Rubin GPU , 但是产品先给大家安排上 。 就在今天 , NVIDIA发布了为LLM中上下文处理所打造的专用GPU——Rubin CPX , 将会采用下一代的架构设计 , 能够实现数倍的性能提升 , 当然需要到2026年才能跟大家正式见面 。
NVIDIA表示在文本推理方面 , 包括了AI提示以及生成响应 , 其中随着提示词越来越多和复杂 , 导致GPU的算力有些跟不上 , 因此需要一款特别打造的专用GPU来专门负责提示词与上下文本的理解 , 而Rubin CPX就是这样一款产品 。 未来Rubin CPX将会成为下一代Vera Rubin平台的一部分 , 搭载Vera CPU以及Rubin GPU , 满血Vera Rubin平台最高拥有8EFLOPS的AI算力 。
Rubin CPX能够拥有128GB的GDDR7显存 , 在专注力性能上与上代相比提升3倍 , 同时NVFP4算力可以达到30PFLOPS , 当然NVIDIA还表示Rubin CPX除了硬件之外 , 还将获得NVIDIA打造的一整套软件栈 , 包括开放模型 , 专门为企业AI任务打造 。
只不过虽然今天NVIDIA已经发布了这款产品 , 但是具体发售需要等到2026年 , 至于为什么这么早就发布这款产品 , 很显然NVIDIA希望尽早获得相关厂商的订单 , 毕竟现在AI硬件供不应求 , 早点给订单 , NVIDIA就可以早点去生产相关的产品 。
推荐阅读
- iPhone 17 系列发布会亮点回顾:高刷与续航升级
- Arm Lumex CSS发布:全新C1 CPU与G1-Ultra GPU详解
- 5999 元起!iPhone 17 正式发布,今年升级太猛了
- 魅族新机官宣:9月15日,正式发布
- 苹果发布会8款新品点评:惊喜不少,遗憾也多!国行版功能缺失
- 北京市通用人工智能产业创新伙伴计划2.0发布
- 5.9mm,刚发布的这轻薄手机,有点意思
- 苹果发布iPhone 17系列、Watch 11和新款AirPods Pro 3
- 苹果发布 iOS 26 RC 版,正式版将在下周发布
- 江波龙SOCAMM2,正式发布!
