AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

【AMD还有大招?不光有Zen6,MI400性能还要涨10倍!】AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片

AMD还有大招?不光有Zen6,MI400性能还要涨10倍!

文章图片



在美国加州圣何塞当地时间6月11日的报道中 , 我们已经介绍过AMD最新的INSTINCT MI350系列GPU和对应的AI RACK解决方案 , 同时也简单提到了2026年和2027年即将登场的两套AI RACK方案 , 分别使用了当年对应的新款EPYC处理器以及MI400和MI500 GPU 。 而在6月12日 , AMD 董事会主席兼首席执行官Lisa Su 博士在ADVANCING AI 2025大会的KEYNOTE演讲中进一步透露了下一代EPYC处理器“Venice”、MI400 GPU和代号“Vulcano”的Pensando超级网卡的细节 。

首先是代号Venice的第六代EPYC , 它采用Zen6架构 , 使用2nm制程 , 最高可拥有256核心 , CPU与GPU之间的连接带宽提升一倍 , 同时性能相对上代可提升70% , 内存带宽也达到了1.6TB/s , 2026年内登场 。 虽然信息还不够多 , 但由此可以推断 , 明年Zen6架构的消费级产品也会出现 , 性能提升幅度也会非常可观 。 明年代号Helios的新一代AI Rack方案就会配备Venice处理器 , 提供更加强大的AI性能和扩展性 。

MI400 GPU昨天的文章里我们已经介绍过了 , 它在MI350系列的基础上进一步大幅提升性能 , FP4/FP8性能高达40PF/20PF , 搭载HBM4显存 , 最高可达432GB , 显存带宽可达19.6TB/s , 扩展带宽也几乎翻倍 , 达到了300GB/s 。


同时 , AMD还明确表示 , 搭载MI400的AI Rack方案相对MI355X最高可带来10倍的性能提升 , 这可以说是相当炸裂的升级幅度了 。

接下来是AI Rack方案里必不可少的“超级网卡” , 目前MI350系列的AI Rack方案里搭载的是刚发布的POLLARA 400 , 数据带宽可达400Gbps , 也就是40万兆网卡 。 而明年推出的Vulcano , 制程升级到3nm , 将会把数据带宽升级到800Gbps , 变成80万兆网卡 , 让GPU的Scale Out带宽最多升级到原先的8倍 , 这也是为什么下一代Helios AI Rack整体性能可以提升那么多的重要原因之一 。
至于2027年即将登场的搭载“VERANO”处理器与MI500 GPU的AI Rack , 目前代号还没有确定 , AMD也没有更多的技术参数透露 , 唯一可确定的是它也会使用800Gbps带宽的Vulcano超级网卡 。


简单总结一下ADVANCING AI 2025发布的重点产品与项目上线时间 。 MI350目前正在加紧生产 , 对应的最终产品今年第三季度上市;ROCm 7则将在8月上线;AMD Developer Cloud服务目前已经上线 , 大家都可以去申请 , 前1500名申请者可以获得10天内25小时的试用权限 , 之后收费标准为每GPU每小时1.99美元 , 目前可选MI300X GPU方案(单GPU或8 GPU) 。 这个收费标准还是比较实惠的 , 对于研究与学习AI的开发者来说非常实用 。
接下来让我们一起逛逛ADVANCING AI 2025大会DEMO展示区吧 。

DEMO区最抢眼的当然就是MI350 GPU和对应的OAM模块、UBB8模块实物了 。 可以看到 , MI350 GPU中间是巨大的XCD与IOD堆叠的Die , 周围是8颗HBM3E显存 , 整颗芯片硕大无比 。 而OAM模块则加上了OAM基板和周边电气元件 , 以便与UBB基板连接 。

而完整的UBB8模块则可以看到基板上搭载了8颗MI350系列GPU 。 从官方白皮书我们可以知道 , 1000W TBP的MI350X提供风冷版UBB模块 , 而1400W的MI355X则只有液冷UBB模块 , 但液冷版更薄 , 因此可以做到单个Rack里放入更多的UBB模块 。

现场我们也见到了POLLARA 400超级网卡的实物 , 看起来非常小巧 , 但却拥有400Gbps高带宽 。 由于性能强悍 , 所以我们也可以看到它配备了硕大的散热器 。

本次大会DEMO区展出最多的就是基于MI350系列GPU的AI 解决方案了 。 这台Supermicro GPU A+服务器就配备了双EPYC 9005/9004处理器 , 8个MI350X GPU , 支持最多6TB DDR5内存 。

来自技嘉的G4L3-ZX1-LAX2 , 是使用MI355X GPU的液冷版AI服务器 。 它可以最多支持12块Pollara 400超级网卡 。

来自MiTAC的MI355X Rack水冷解决方案 。 可以看到Rack里安装了多个不同的UBB模块 。

来自和硕的方案 , 可以看到里面除了MI355X AI GPU服务器模块之外 , 还有存储模块、AI加速服务器模块等等 。

来自华擎的4U/8U方案 , 都是配备MI355X GPU的型号 。

来自Cisco的方案 , 配备MI350 GPU和MI210 GPU 。
然后是一些AI应用方面的展示DEMO , 在之前ADVANCING AI 2024上也见过 , 只不过现在都迭代到了新的版本 , 效率更高、功能更加强大 。

KeyShot目前的AI功能相当强大 , 它支持AI分析3D模型推荐合适的材质;使用AI自动调整照明设置;智能设置相机位置、景深和场景布局;自动场景匹配和AI降噪 。

微软Copilot的Click to do可以通过AI将操作与屏幕内容联系起来 , 它现在已经可以完美支持Ryzen AI NPU了 , 例如AMD Ryzen AI 300系列移动处理器 , 就能很好地发挥它的功能 。

大名鼎鼎的AMUSE目前也可以通过Ryzen AI NPU实现SD3的AI出图了 。

DaVinci Resolve的AI功能基于DirectML API , 可以在AMD平台上充分发挥性能 。

搭载Radeon AI PRO R9700和线程撕裂者处理器的平台现场展示通过ROCm in Windows和Comfy UI实现AI出图 。 实际上 , 目前的RX 9000消费级显卡也可以支持ROCm in Windows了 , 对于普通用户来说也不失为一个高性价比的AI方案 。

诸如GAIA、Blender、Belt、STYRK AI等工具目前也能支持Ryzen AI的NPU和iGPU , 对于移动用户来说 , 锐龙AI本的实用性也越来越高 。

通过AMD显卡实现的AI渲染技术目前正在研发中 。

AMUSE通过AMD GPU实现对实时采集的视频添加AI滤镜 , 生成不同风格的视频画面 。

OK , 其实DEMO区展示的内容还不止这些 , 可以看到每一年的ADVANCING AI大会都会给我们带来新的惊喜 。 例如在去年的ADVANCING AI大会上 , 一些AI应用还并不能完全利用Ryzen AI NPU , 而本次大会展示的新版本就已经对Ryzen AI NPU提供了完美支持 。 考虑到AMD对开发者的支持力度越来越大 , 不但有各种竞赛和激励制度 , 还上线了提供强大GPU服务器的开发者云平台 , 我们有理由相信未来基于AMD平台的AI应用会越来越出色、越来越好用 , 同时 , 这也会让AMD在AI领域获得更多的支持与份额 。

    推荐阅读