AMD EPYC 9004启用“热那亚”CPU提升35%性能

AMD 的 EPYC 9004 Genoa CPU 已经在 Phoronix 的各种 AVX-512 基准测试中进行了测试 , 看起来最新的 Zen 4 部件在保持相同功率的同时大幅提升了性能 。
AMD EPYC 9004“热那亚”CPU 在启用 AVX-512 的情况下以相同的功率提供 35% 的性能提升

AMD EPYC 9004启用“热那亚”CPU提升35%性能

文章插图
AMD EPYC 9654 处理器是一系列新服务器处理器之一 , 这些处理器在发布时就被誉为“地球上最快的服务器 CPU ” ,  Phoronix的Michael Larabel以令人印象深刻的方式对新的第四代 Genoa CPU 进行了测试Ubuntu 22.10 操作系统环境中的 130 个基准测试 。
这些基准测试没有遗漏任何东西——性能、温度、频率限制等都经过了测试 , 以了解新的 EPYC(霄龙)处理器如何处理最近添加到这个新处理器系列中的 AVX-512 的实现 。
AMD Zen 4 引入了AVX-512 指令集 , 该指令集首先由 Intel 提出 , 并整合到该公司的 Intel Xeon Phi x200、Skylake-X 和最近的 Xeon Scalable 处理器中 。AVX-512 指令集中的每个扩展都必须独立执行 。最近 , AVX-512 已在多个实例中使用 , 例如提高性能 。据称 , 与 AMD 合作后 , AVX-512 将在处理视频、分析金融方程式和模拟科学进步方面提高性能和管理数据 。
Larabel 已经测试了其他带有 AVX-512 active 的 AMD 处理器 , 例如 Ryzen 9 7950X 和 EPYC 9004 系列 。在他之前的测试中 , AVX-512 对这两款处理器都非常有利 , 显示出更高的效率 , 同时保持较低的功耗和时钟频率 , 尤其是在大型工作负载中 。他在最近的测试中使用了 AMD EPYC 9654 2P 处理器 , 在 Ubuntu 22.10 中激活和停用了 AVX-512 , 该版本使用当前的 Linux 内核 (v6.1) 。
在他围绕人工智能的基准测试中 , 启用 AVX-512 的性能比停用指令集的性能高 35%(在某些情况下甚至更高) 。AI 工作负载中的处理器功耗几乎可以忽略不计 , 但在处于活动状态时 , AVX-512 实例通过保持较低的功耗水平仍然更好 。
一组与 AI 相关的基准测试 , Neural Magic DeepSparse 1.1 , 确实在新的 AMD EPYC 9654 处理器中显示了 AVX-512 的可喜结果 , 但它不像其他一些机器学习工作负载测试那样引人注目 。Neural Magic DeepSparse 是“一种稀疏感知推理运行时” , 可在处理器和 API 上提供图形处理性能 , 从而实现机器学习的集成 。您可以在此处了解更多信息 。
另一个基于 AI 的基准测试 , 移动神经网络 2.1 , 是一系列基准测试的“奇怪的鸭子” , 因为 AVX-512 实施表现更差 , 并且仅在模型“Inception-v3”的特定测试中 。Larabel 提到软件本身可能是催化剂 , 但没有明确的答案 。
【AMD EPYC 9004启用“热那亚”CPU提升35%性能】加密基准测试和腾讯的 NCNN 模型很受欢迎 , 因此作者转而使用专注于 AVX-512 优势的英特尔专用软件 。同样 , AMD EPYC 在支持 AVX-512 的测试中表现出色 。在运行 Intel Open Image Denoise (v1.4.0) 基准测试时 , 有两个实例显示的结果可以忽略不计 , 但 Larabel 显示使用活动的 AVX-512 时功耗仍然较低 。
Larabel 现在结束了他的测试 , 但指出与当前的英特尔至强可扩展处理器相比 , AMD 的 Zen 4 架构继续为新一代显示出有利的结果 , 看起来即使是即将推出的 Sapphire Rapids Xeon 芯片也很难与 Genoa CPU 竞争.