Xe2来到独显,英特尔“战斗法师”显卡解析

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

文章图片

Xe2来到独显,英特尔“战斗法师”显卡解析

如今在显卡市场中 , 英特尔旗下的ARC A770可以说是一款极为独特的产品 。 一方面 , 它客观上有着4096SP、最高16GB显存的规格 , 同时售价普遍只有1500元左右 。

但另外一方面 , 对于这款英特尔“旗舰独显”的看法 , 不同的用户也截然不同 。 有些人在它刚上市时就早早入手 , 然后对其早期的游戏兼容性和性能有些不满;但也有些用户指出 , ARC A770的视频编码性能极其强悍 , 在部分专业领域的表现甚至超过了RTX4090 。 当然 , 还有一些“I卡”的持续使用者会表示 , 随着英特尔迄今为止已经发布的多达50多个驱动版本更新 , ARC独显的实际游戏表现早已今非昔比 。

但不管怎么说 , 英特尔并没有放弃他们的独立显卡产品线 。 就在2024年12月3日 , 英特尔正式公布了他们的下一代独显 , 也就是此前传言中的ARC B系列 。
Xe2架构加持 , “战斗法师”底层效率大涨
如果之前有看过我们三易生活对于英特尔LunarLake“月湖”的解析内容《英特尔LunarLake架构解析:单核暴增、Xe2首秀》 , 可能还记得它最大的变化之一就是首次引入了全新的Xe2 GPU架构 。 此次的ARC B系列独显也同样是基于Xe2架构 , 两者在基础设计上的差异很小 。

这也就意味着 , 代号“战斗法师(Battlemage)”的ARC B系列独显 , 这次同样具备Xe2架构的那些标志性改进 。 比如 , 它将每个Xe核心里的矢量引擎、矩阵扩展引擎的数量都减少了一半 , 但同时将这些引擎的位宽全部翻倍 , 从而使得总体的处理性能反而实现了提升 。

与此同时 , Xe2架构还大幅增强了针对光线追踪、采样反馈、网格渲染等最新游戏图形技术的硬件架构设计 。 用英特尔方面的话来说 , 与前代的Xe架构相比 , 新设计在单个时钟周期下的光追性能达到了前代的1.6倍 , 采样反馈性能为前代2.7倍 , 网格渲染性能可达4倍以上 。

看到这里 , 大家是不是觉得很眼熟?没错 , 英特尔方面显然也很明白 , 他们暂时还没有办法去与NVIDIA、AMD这种已经在独显市场打拼多年的对手 , 去比拼老API下的优化水平 。
所以从初代ARC独显开始 , 针对DX12、光追、Vulkan等最新的图形标准去尽可能地做针对设计 , 就一直是英特尔GPU的一大突出特征 。 比如在Xe2架构里 , 它甚至专门对DX12的“Excute Indirect”技术特性进行了硬件设计 。 这个新特性允许GPU不需要等待CPU指令 , 独立地进行高并发绘图操作 。 在某些特定场景 , 它甚至可以带来12倍以上的底层执行效率提升 。

除此之外 , Xe2架构还有一个很“时髦”的新特性 , 那就是它具备了比过去更大的缓存 。 具体来说 , 现在它的每个Xe核心具有256KB的L1缓存(前代为192KB) , 同时整张显卡的L2缓存也扩大了 。 如此一来 , 显卡对于显存带宽的需求将会进一步下降 , 而这自然就意味着新一代的ARC独显可以配备位宽、频率都更小的显存 , 实际上也就提高了性价比 。
超分、超帧、降延迟 , XeSS2功能大扩展
在此前的Xe架构上 , 英特尔方面带来了自己的“AI游戏超分”功能XeSS 。 与竞争对手的DLSS或FSR相比 , XeSS的一大特征就是它既能在专门的AI硬件上运行(也就是带有XMX单元的显卡、比如ARC独显) , 还能使用GPU本身的浮点算力驱动(比如之前不带XMX单元的ARC核显) 。

不过由于Xe2架构这次无论在独显还是核显上都“标配”了XMX单元 , 所以新的XeSS2里的XeSS-SR超分 , 自然也就针对这一点做出了改变 。 现在它专注于运行在XMX单元上 , 从而更多地解放GPU本身的浮点性能用于画面绘制 。

不仅如此 , 或许也因为XMX单元在新的架构中成为了“标配” , 也促使英特尔如今更积极地深挖它的功能潜力 。 伴随着ARC B系列独显的发布 , 我们也迎来了两个全新的英特尔AI游戏优化功能、也就是XeSS-FG和XeLL 。

XeSS-FG其实很好理解 , 它就是英特尔版本的“帧生成”技术 。 根据官方透露的信息显示 , XeSS-FG是借助AI算法来实现对游戏画面的光流推测和中间帧插帧处理 。 因此它并不像NVIDIA的帧生成那样 , 需要GPU内部有专门的硬件模块 。 而与AMD的类似技术相比 , 因为使用的是GPU内部的独立AI单元(而不占用GPU流处理器本身的算力) , 所以又会有更高的效率 。

相比之下 , XeLL则是英特尔版本的游戏低延迟功能 。 根据官方资料显示 , 它能够将游戏从输入到画面输出的延迟降低多达45% 。

而且在Xess2里 , XeSS-SR(也就是AI超分)、XeSS-FG和XeLL可以同时开启 , 此时就能够实现游戏渲染负载的大幅降低、数倍的帧率提高 , 同时还能带来更低的操作延迟 。 很显然 , 对于追求“帧率为王”的游戏玩家来说 , 这也就意味着相当大的吸引力 。
首发两款中端产品 , 超低价格瞄准“钉子户”
聊完了底层架构和功能层面的变化 , 接下来就该来看看实际的产品层面 。

根据此前的爆料信息 , Xe2的独显产品线此次至少包括“BGM-G21”和“BGM-G31”两款核心 。 不过今天官方公布的ARC B580和ARC B570 , 都是基于“BGM-G21”这颗相对小的核心而来 , 所以真正的“大家伙”可能还得再等等 。

具体来说 , ARC B580拥有20组Xe核心 , 共计2560流处理器、160个纹理单元、80个光栅单元、20个光追核心 , 以及160个Tensor核心 。 它配备12GB的GDDR6显存 , 显存等效频率19000MHz、等效带宽456GB/s 。
定位相对较低的ARC B570则是18组Xe核心 , 因此是2304流处理器、144纹理单元、72个光栅单元、18个光追核心和144Tensor核心 。 它的显存频率与B580相同 , 不过位宽和容量缩减到160bit与10GB , 显存带宽380GB/s 。

【Xe2来到独显,英特尔“战斗法师”显卡解析】当然 , 作为英特尔的“惯例” , ARC B580这次也有公版(官方称之为“限量版”)产品 , 它的频率会比普通版本更高一点 。 不过从我们的经验来说 , 这个频率也就相当于各显卡厂商的“非公官超”水平 , 不会特别“过分” 。 但正如大家所见的那样 , 限量版更多的价值或许还是体现在其特别的包装设计 , 以及出自英特尔的极简造型上 。

没错 , 现在大家看到的 , 就是英特尔ARC B580显卡的官方“限量版”实物 。 可以看到 , 它采用了一个略带流线型的双风扇散热器设计 , 正面极其简洁 。 不过它的风扇换用了封闭式扇框的造型 , 这种设计理论上可以降低扇叶振动 , 并减少风扇边缘的“漏气” , 从而提高散热效率 。

显卡的背部则是硕大的开孔区域 , 从中可以看到密集的鳍片与热管 。 当然 , 也这意味着ARC B580与它的同级别竞争对手一样 , 都选择了“短PCB”的设计 。 从我们与英特尔方面的沟通中得知 , 他们认为这一代的ARC独显确实可以有SFF规格的产品 , 也就是用于那些“独显小主机”的单槽、甚至是半高形态产品 。

除此之外 , 限量版的ARC B580还有一个很有意思的地方 , 那就是它背板上的印刷乍看之下似乎是“颠倒”的 。 但实际上 , 这明显是为了迎合如今的侧透机箱而做的设计 , 只要将其装进机箱里从外侧观察 , 那么显卡“顶部”的LOGO和背板上的文字方向就都会“正过来” 。 不得不说 , 英特尔如今也开始注重旗下产品的颜值属性了 , 这还挺令人意外 。

有趣的是 , 根据英特尔方面的说法 , ARC B580/B570这次的性能定位是“RTX4060或RX7600”级别 , 但其目标消费群体瞄准的却是那些至今还在使用GTX1060、GTX1660这些“老卡”的玩家 。 事实上 , 英特尔也专门提到了这些老显卡的“致命短板” , 比如完全不支持光追、不支持游戏超分和插帧 , 以及对最新版DX12和Vulkan API支持不佳等等 。

不得不说 , 在看到ARC B580/B570仅219美元(约合人民币1594.87元)起的定价 , 以及远比前代更为丰富的首发显卡厂商名单 , 可以很明显感受到英特尔切入独显市场的决心 。 至于它们的实际表现是否足够给力 , 大家不妨耐心期待我们三易生活后续的首发评测 。

    推荐阅读