NVIDIA发布LLM专用GPU：3倍注意力提升，26年发布_英伟达

文章图片

【NVIDIA发布LLM专用GPU：3倍注意力提升，26年发布】
NVIDIA已经在GTC 2025上公布了下一代Rubin GPU的部分消息，不过现在看起来AI实在是太过于火爆，导致NVIDIA即使没有正式发布Rubin GPU ，但是产品先给大家安排上。就在今天， NVIDIA发布了为LLM中上下文处理所打造的专用GPU——Rubin CPX ，将会采用下一代的架构设计，能够实现数倍的性能提升，当然需要到2026年才能跟大家正式见面。

NVIDIA表示在文本推理方面，包括了AI提示以及生成响应，其中随着提示词越来越多和复杂，导致GPU的算力有些跟不上，因此需要一款特别打造的专用GPU来专门负责提示词与上下文本的理解，而Rubin CPX就是这样一款产品。未来Rubin CPX将会成为下一代Vera Rubin平台的一部分，搭载Vera CPU以及Rubin GPU ，满血Vera Rubin平台最高拥有8EFLOPS的AI算力。

Rubin CPX能够拥有128GB的GDDR7显存，在专注力性能上与上代相比提升3倍，同时NVFP4算力可以达到30PFLOPS ，当然NVIDIA还表示Rubin CPX除了硬件之外，还将获得NVIDIA打造的一整套软件栈，包括开放模型，专门为企业AI任务打造。

只不过虽然今天NVIDIA已经发布了这款产品，但是具体发售需要等到2026年，至于为什么这么早就发布这款产品，很显然NVIDIA希望尽早获得相关厂商的订单，毕竟现在AI硬件供不应求，早点给订单， NVIDIA就可以早点去生产相关的产品。

NVIDIA发布LLM专用GPU：3倍注意力提升，26年发布

推荐阅读

QQ如何更改密码 QQ怎么更改密码

糖醋花生凉拌做法步骤

vivoy30怎么设置来电闪光灯

华为手机改密码的方法

南亚面积最大的国家是什么

健身新手刚开始怎么练最好

王安石变法的内容和意义王安石变法内容有哪些

工商银行信用卡销户怎么办理工商银行的信用卡注销流程

石景山游乐园门票怎么预约

普通凉拌面怎么做

三衢道中描写的是什么时节

新机好像没什么花头

b612美颜相机,B612美颜相机下载

3dmax使用衰减贴图的简单操作。

高中开学周的作文

什么样的车可以改天然气