Arm全新IP解析:功耗值得关注,小核前景堪忧

Arm全新IP解析:功耗值得关注,小核前景堪忧

文章图片

Arm全新IP解析:功耗值得关注,小核前景堪忧

文章图片

Arm全新IP解析:功耗值得关注,小核前景堪忧

文章图片

Arm全新IP解析:功耗值得关注,小核前景堪忧

文章图片

Arm全新IP解析:功耗值得关注,小核前景堪忧

文章图片

Arm全新IP解析:功耗值得关注,小核前景堪忧

最近这几天 , Arm在上海召开Arm UNLOCKED峰会 , 正式发布了面向移动端的Arm Lumex计算子系统(Compute Subsystem CSS) 。
什么是Lumex CSS?用最简单的话来说 , 它其实就是Arm如今的一种“营销概念” 。 Lumex CSS至少包括Arm全新的C1系列CPU架构设计、G1系列GPU架构设计、C1-DSU核间总线设计 , 以及其他一些周边系统IP设计 , 全部“打包”起来的产物 。

需要注意的是 , Lumex CSS并不等于完整的SoC架构授权 , 因为它本身并不包括NPU、基带、电源管理、ISP等许多常见移动平台的必备组件 。 这也是为什么今年“Arm CSS”这个概念最开始引发外界关注时 , 就有不少人辟谣“即便买了完整的Arm CSS , 也没法直接做成手机SoC”的原因 。

当然 , 从目前网络中流传的部分信息来看 , 现有的各一线大厂 , 基本都是基于Arm的架构、甚至指令集授权去做二次开发 。 所以Lumex作为“官方公版”的意义 , 本质上还是与过去一样 , 主要针对的是自研能力不足的中小芯片厂商 。
但即便如此 , 这并不意味着此次公布的Lumex CSS对于关注手机行业 , 对下一代移动设备平台好奇的朋友来说就没有意义了 , 因为深入探究其中的内容 , 还是可以发现不少有趣的、值得一讲的东西 。
产品命名逻辑大改 , 但实际效果还有待商榷
首先正如前文中已经提及的那样 , Arm Lumex CSS这次包含了全新的CPU和GPU IP 。 而且与过去Arm经常“只更新大核、不换代小核”的操作不同 , 这一次他们不仅将全部的CPU、GPU架构都进行了换代 , 并且将整个产品命名体系都做了很大的调整 。

具体来说 , Arm发布了四款新的CPU IP , 分别是C1-Ultra、C1-Premium、C1-Pro和C1-Nano 。
从定位来看 , C1-Ultra代表的是旗舰SoC里的“超大核” , 也就是接替现在Cortex-X925的位置 。
C1-Premium代表的是“次旗舰大核” , Arm对它的解释是架构与超大核相同 , 但缓存没那么大 , 且使用密度库(也就是主频会更低、但能耗也更低)制造 。 换句话说 , 它其实相当于是将联发科之前用过的Cortex-X4m“转了正” , 正式独立为一条CPU产品线 。

剩下的C1-Pro和C1-Nano就很好理解了 , 它们分别继承了Cortex-A725和Cortex-A520的产品定位 。
与此同时 , Arm还发布了名为“Mali G1”的GPU IP家族 。 它从最入门的版本到最高配型号之间倒是并无架构区别 , 而仅以着色器核心数量进行版本区分 。 其核心数量可在1核心到24核心之间进行定制 , 并根据核心数量的不同 , 被区别为G1-Ultra、G1-Premium、G1-Pro至少三个级别 。
但这里Arm既没有提到每个版本之间具体的核心数量标志差异 , 也并未说明是否存在入门款的“G1”或“G1-Nano” 。
新IP性能普遍提升 , 不过功耗值得注意
其实从命名逻辑来说 , Arm这一轮新品体系很显然是想要表达它们“全新的”、“与过去不同”的身份 。 另一方面 , 与过去的三位数字命名法相比 , 新的IP命名规律显然是想要让未来换代之后的“代次区分”变得更明显 。 比如将来的G2、G3 , 大家很快就能知道比现在的G1更新 , 的确就会比现在X925、A710、A520这样的命名来得更易区分“新旧”关系 。
但Arm现在的这种命名方式也带来了一个问题 , 那就是消费者更难直观地判断同代次之间的核心性能高低程度了 。 是的 , C1-Ultra当然要比C1-Nano快得多 , 但具体“快多少”呢 , 就更不方便进行判断了 。
而且哪怕是对比上代产品 , Arm也并没有将新IP的性能进步幅度完全说清 。

比如他们声称 , 与前代“超大核”Cortex-X925相比 , C1-Ultra的IPC(单时钟周期性能)提升了12% , 微架构性能表现提升了26% 。
但Arm方面却没有给出C1-Premium相比于前代“次旗舰超大核”的性能改进幅度具体数据 。 虽然这可能是因为X925本身就没有次旗舰变体 , 要对比就只能找出前前代的X4m , 但也不排除新的次旗舰架构进步幅度没那么大、对比数据不够好看的可能 。

相比之下 , 他们对于C1-Pro的性能进步幅度给出的数据又变得具体了起来 。 根据Arm方面的说法 , 与Cortex-A725相比 , C1-Pro在同等性能下的功耗要低26%;如果是达到同等功耗 , 那么C1-Pro的性能将可以比Cortex-A725块11% 。 同时如果两者均设定为相同的主频 , 则C1-Pro的性能最高可以比Cortex-A725高出16% 。
从这三组数据就可以知道 , 在相同主频的前提下 , 新的C1-Pro大核功耗其实是会比Cortex-A725略高一点的 , 但因为性能进步更大 , 所以算起来能效比依然是上涨了 。
最后 , 则是“小核心”C1-Nano 。 Arm对于它的性能数据给得比较详细 , 但可惜从这些数据来看 , C1-Nano本身的改进并没有将重点放在性能上 , 而是更多地体现为面积的缩小、功耗的降低 , 以及支持最新的指令集 。

按照Arm方面的说法 , 在SPECint2017中 , C1-Nano对比Cortex-A520综合跑分提升大约为5.5% 。 在处理相同程序的前提下 , 它的能效提升了26% 。

【Arm全新IP解析:功耗值得关注,小核前景堪忧】最后 , 则是Mali G1-Ultra GPU 。 Arm方面表示 , 它在跑分软件和游戏中的性能相比上一代(G925)提升了20% , 同时单帧功耗降低了9% 。 那么经过计算就可知 , 此时它的整体功耗其实是上涨了的 , 涨幅约为9.2% 。 好在此时G1-Ultra的光追性能可以达到前代的两倍 , 对于未来可能出现的“重光追”手游来说 , 它依然有望带来远超20%的帧率提升幅度 。
新的旗舰手机注定更快 , 但入门款则前途未卜
说了这么多 , 那么Arm的这一批新架构对于即将到来的新一代智能手机以及SoC来说 , 意味着什么呢?
首先必须要注意的一点 , 是无论在Arm的规划还是目前出现的传言中 , 新的旗舰移动平台都不可能使用C1-Nano“小核心” 。 Arm的说法 , 是顶级旗舰可能会使用两颗C1-Ultra搭配六颗C1-Pro , 我们甚至不排除厂商减少“中核(C1-Pro)”数量、加入更多的“次大核(C1-Premium)” , 来换取更高跑分成绩的可能 。

综合前面的分析以及行业里近年的动向来看 , 除非台积电的N3P工艺再度“发威” , 否则在各家大概率会在进一步提高旗舰SoC峰值主频的前提下 , 基于新CPU、新GPU的新款旗舰平台 , 峰值功耗恐怕会有进一步的上涨、而非下降 。

当然大家倒也不必紧张 , 因为新架构的IPC确实是提升了 , 这也就意味着在跑分之外的场景、包括重负载游戏 , 只要不出现新的“性能杀手” , 那么新旗舰的实际运行频率注定会比现在的平台更低 。 结果就是日常使用的能效肯定会有显著改善 , 甚至重负载游戏功耗都有可能会进一步降低 。
相较之下 , 更让人担心的反倒是那些单纯基于C1-Nano的低功耗设备 。 虽然目前的各种证据显示 , 新架构客观上对比Cortex-A520的确有所改进 , 但一方面它的性能进步幅度显然比其他的“大核”们要小许多 。 另一方面 , 随着越来越多的旗舰、次旗舰平台“弃用”CPU小核 , 无论软件开发者、芯片设计厂商 , 甚至是未来的Arm , 都有可能会对小核的改进越来越失去“动力” 。

要知道在隔壁苹果的Apple Watch里 , 驱动手表的CPU架构早就已经是源自A16能效核的““Sawtooth”方案 , 也就是缩小版的“中核(定位更接近A725或这次的C1-Pro)”了 。 对于主流消费电子产品来说 , 纯粹低功耗“小核”的退场 , 很有可能已经只是时间问题 。
【本文图片来自网络】

    推荐阅读