单路AMD EPYC 7351P CPU Linux性能基准测试
评测
2018-08-05

AMD EPYC 7351P CPU的成本约为825美元,16核心32线程,2.4G主频,2.9G睿频,32M缓存,内存最大支持频率2666,8通道DDR4内存最高支持单路16条128G 2666频率 多达2TB的内存,多达128个高速I / O通道PCIe。

以下是具有该功能集AMD产品页面这是处理器的lscpu输出:

AMD-EPYC-7351p-lscpu.jpg


AMD EPYC 7351p Lscpu

由于AMD EPYC架构对许多人来说将是新的,我们希望提供该CPU功能集输出。虽然你可能会在lscpu输出中看到8MB L3缓存,但该芯片实际上带有惊人的64MB L3缓存。这意味着这个约825美元的CPU拥有比英特尔顶级Xeon Scalable 28核心部分更多的L2 + L3缓存。AMD通过使用每个封装的四个裸片代替英特尔的单芯片设计实现了这一点,您可以在我们的AMD EPYC和英特尔至强可扩展架构终极深潜中阅读。

测试配置

到9月底,我们将在一个共同的Tyan EPYC平台上测试每个AMD EPYC SKU,并在另一个平台上开始工作。以下是我们使用的基本硬件配置:

  • CPU:AMD EPYC 7351P

  • 服务器准系统:Tyan Transport SX TN70A-B8026(B8026T70AE24HR)

  • 内存:8x 16GB 128GB DDR4-2666 RDIMM(三星)

  • SSD:1x Intel DC S3710 400GB SATA SSD

  • NIC:1x Mellanox ConnectX-3 Pro EN VPI

Tyan-Transport-SX-B8026T70AE24HR-Front-and-Rear.jpg

Tyan Transport SX B8026T70AE24HR前后

该系统的关键是它支持24x NVMe U.2 NVMe SSD而无需使用Broadcom PLX PCIe扩展器。这是直接来自单个SKU的96通道PCIe 3.0。AMD EPYC的主要优势之一是单个EPYC CPU可以使用128x PCIe通道,数量与双插槽配置相同。Tyan通过提供可以处理24x NVMe驱动器的单插槽系统以及10/25/40/50 / 100GbE的I / O来应对这一机遇。

Tyan-Transport-SX-B8026T70AE24HR-Internal-1.jpg

泰安SX B8026T70AE24HR内部


AMD EPYC 7351P基准测试

在本练习中,我们使用传统的Linux-Bench脚本,帮助我们查看多年来一直使用的跨平台“最小公分母”结果以及我们更新的Linux-Bench2脚本的几个结果。此时,我们的基准测试会话需要数天才能运行,而且我们的数据点已经超过了一千个。我们还为希望了解其软件如何在最新硬件上运行的软件公司运行工作负载。因此,这是我们收集的数据的一小部分样本,可以公开分享。我们的立场始终是我们很乐意提供一些免费数据,但我们也有服务让公司在我们的实验室中运行自己的工作负载,例如我们的DemoEval服务。

Python Linux 4.4.2内核编译基准测试

这是STH在过去几年中最需要的基准之一。任务很简单,我们有一个标准的配置文件,来自kernel.org的Linux 4.4.2内核,并利用系统中的每个线程进行标准的自动生成配置。我们以每小时编译的方式表达结果,以使结果更易于阅读。

AMD-EPYC-7351P-Linux-Kernel-Compile-Benchmarks.jpg


AMD EPYC 7351P Linux内核编译基准测试

在这里,您可以看到EPYC 7351P的强势展示,这将是一个反复出现的主题。有几点需要注意,首先,单个插槽EPYC 7351P的850美元以下的CPU与1.54美元/小时的AWS c4.8xlarge实例以及大部分E5系列相比都非常有利。此外,我们看到AMD实现了“P”系列单插座部件的承诺,能够与英特尔的低端双插座部件(V4和Xeon Silver系列)进行直接对接。

c-ray 1.1性能

我们多年来一直使用c-ray进行性能测试。它是一种光线跟踪基准测试,非常受欢迎,可显示多线程工作负载下处理器的差异。

AMD-EPYC-7351P-c-ray-4K-Benchmark-EPYC-Comparison.jpg


AMD EPYC 7351P C Ray 4K基准EPYC比较

像c-ray(和Cinebench R15 for Windows)这样的基准测试对微体系结构非常敏感。它们可能不是用来比较AMD与英特尔相比的最佳基准,而英特尔通常不会与英特尔相比。我们仍然希望使用我们的传统c-ray 1.1测试提供数据。

正如我们在使用四核Intel Xeon Platinum 8180 CPU 实际打破Cinebench R15时所看到的那样,如果需要生成大量线程,则通常需要更长的基准测试或线程生成成为限制因素。在AMD EPYC和Xeon Gold和Platinum的高端,这成为一个重要的考虑因素。结果,我们开始构建一个更复杂的渲染,我们正在配音8K,以便为我们提供更长的渲染运行时间。以下是更大的基准测试中几种不同的EPYC选项:

AMD-EPYC-7351P-c-ray-8K-Benchmark-EPYC-Comparison.jpg


AMD EPYC 7351P C Ray 8K基准EPYC比较

这可能是更多的EPYC配置,任何人都放在一个图表中。对于那些对EPYC 7281和EPYC 7301感到疑惑的人来说,c-ray并没有达到L3缓存。EPYC 7301具有EPYC 7281缓存的两倍,我们将在该审查期间显示其影响。c-ray和Cinebench R15的简单性隐藏了更大的L3缓存带来的好处。

有趣的是,您可以在此图表上看到8个核心,16个核心,32个核心和64个核心产品之间的明确分组。24个核心部分是精加工,但我们将在未来几天内完成基准测试。我们认为AMD EPYC 7601在价格标签方面更具特色,而EPYC 7200和7300系列部件肯定更为主流。

7-zip压缩性能

7-zip是一种广泛使用的压缩/解压缩程序,可以跨平台工作。我们在早期使用Windows测试开始使用该程序。它现在是Linux-Bench的一部分。

Single-CPU-EPYC-7351P-7zip-Benchmark.jpg

单CPU EPYC 7351P 7zip基准测试

这是一个拥挤的图表,但原始核心数量正在推动AMD EPYC 7351P的一些令人敬畏的数字。要达到AMD EPYC 7351P以上,需要双Silver 4114 CPU,价格接近2倍。

NAMD表现

NAMD是由伊利诺伊大学厄巴纳 - 香槟分校Beckman高级科学与技术研究所的理论和计算生物物理学小组开发的分子模拟基准。我们将在不久的将来在下一代Linux-Bench中使用GROMACS来增强它。通过GROMACS,我们一直在努力支持英特尔支持AMD Zen架构的Skylake AVX-512和AVX2。以下是旧数据集的比较结果:



AMD-EPYC-7351P-NAMD-Benchmark.jpg


AMD EPYC 7351P NAMD基准测试

虽然我们正在过渡到GROMACS,但我们有一个巨大的NAMD数据集,未针对AVX-512进行优化。

Sysbench CPU测试

Sysbench是另一个广泛使用的Linux基准测试。我们专门使用CPU测试,而不是我们用于某些存储测试的OLTP测试。

AMD-EPYC-7351P-Sysbench-CPU-Benchmark.jpg


AMD EPYC 7351P Sysbench CPU基准测试

这款AMD EPYC 7351P介于双插槽Intel Xeon Silver 4108和Silver 4110配置之间。这是一个很好的结果,因为它们的价格与单个EPYC 7351P的价格大致相同。

OpenSSL性能

OpenSSL广泛用于保护服务器之间的通信。这是许多服务器堆栈中的重要协议。我们先来看看我们的标志测试:




AMD-EPYC-7351P-OpenSSL-Sign-Benchmarks.jpg


AMD EPYC 7351P OpenSSL标志基准测试

验证号码:

AMD-EPYC-7351P-OpenSSL-Verify-Benchmarks.jpg


AMD EPYC 7351P OpenSSL验证基准测试

再一次,我们看到AMD EPYC 7351P的性能在这里闪耀,使其接近双Xeon Silver 4110.这无疑支持了AMD对P系列部件的价值主张。这也是为什么我们看到有这么多供应商使用AMD单插槽服务器进入市场的原因。

UnixBench Dhrystone 2和Whetstone基准测试

STH中一些运行时间最长的测试是令人尊敬的UnixBench 5.1.3 Dhrystone 2和Whetstone结果。它们肯定会老化,但是,当我们将它们排除在外时,我们会不断地收到它们的请求,以及许多生气的注释。UnixBench被广泛使用,因此我们将其包含在此数据集中。以下是Dhrystone 2的结果:

AMD-EPYC-7351P-Unixbench-dhrystone-2-Benchmark.jpg


AMD EPYC 7351P Unixbench Dhrystone 2基准测试

磨刀石的结果如下:

AMD-EPYC-7351P-Unixbench-Whetstone-Benchmark.jpgAMD EPYC 7351P Unixbench Whetstone Benchmark

对于AMD EPYC 7351P来说,这无疑是一个很棒的展示。英特尔竞争对手的单插座部件(价格明智)是Xeon Silver 4114.该CPU的数字远低于我们对EPYC系列的看法。

GROMACS STH小型AVX2 / AVX-512已启用

在Linux-Bench2中,我们对单插槽和双插槽机器使用“小”测试。我们的中等测试更适合高端双插槽和四插槽机器。我们的GROMACS测试将使用AVX-512和AVX2扩展(如果有)。



AMD-EPYC-7351P-GROMACS-Benchmark.jpg


AMD EPYC 7351P GROMACS基准测试

我们添加了一些更大更昂贵的配置,即双EPYC 7281和单个Xeon Gold 6138结果,以提供一些透视感。尽管AVX-512是英特尔至强可扩展的关键功能,但英特尔决定在Xeon Silver产品线上实现其效果。它通过降低时钟速度和移除第二个计算单元来实现这一目的。因此,支持AVX2而非AVX-512的AMD EPYC能够跟上价格的2倍或更多的Xeon Silver配置。

在这里添加单独的Xeon Gold 6138结果只是为了显示Xeon Gold 6100和Platinum系列CPU从更高的时钟和AVX-512中受益多少。即使是14核/ 28螺纹Xeon Gold 6132也将轻松超越16核AMD EPYC 7351P。对于AVX-512的性能,Xeon Gold 6132的成本几乎是AMD EPYC 7351P的3倍。从系统的角度来看,如果你做得很重AVX-512英特尔仍然拥有强大的价值主张,其Xeon Gold系列超过AMD EPYC。通过英特尔在Xeon Silver系列上实现的产品功能细分,它根本没有竞争力。

国际象棋基准测试

国际象棋是一个有趣的用例,因为它具有几乎无限的复杂性。多年来,我们收到了许多带回国际象棋基准的请求。我们一直在分析系统,并准备开始分享结果:

AMD-EPYC-7351P-Chess-Benchmark.jpg


AMD EPYC 7351P国际象棋基准

大量内核和更高的时钟速度有助于AMD EPYC。事实上,在这个工作量下,唯一一款低于Intel Xeon Silver 4116(价值1000美元)的EPYC就是AMD EPYC 7251 520美元。

AMD EPYC 7351P功耗

等式的另一面是功耗。AMD EPYC 7351P正在推出一些令人印象深刻的基准测试数据,但确实存在相关成本。以下是我们在几次运行后在PDU上看到的内容:

AMD-EPYC-7351p-Power-Consumption-70-Percent-Load-and-Max.jpg

AMD EPYC 7351p功耗70%负载和最大值

在208V PDU上,在17.7C和71%RH下测得的空闲功耗约为75W。我们在这里显示的测试窗口具有+/- 0.3C和+/- 2%RH的变化。

在功耗方面,同样没有安装24x NVMe驱动器,这是一个与Xeon Silver相当的闲置结果。最大功耗和我们显示的70%负载都显着高于单插槽Xeon Silver或双Xeon Silver 4110系统。作为示例,双Intel Xeon Silver 4110设置不会达到运行相同工作负载的200W以上。

AMD在低于1000美元的细分市场中提供了很多性能。与此同时,这是以牺牲功耗为代价的。如果您在CPU和系统上节省1000美元,并为另一个.12kW节省15美元/月,这是一个相当容易的TCO计算。

市场定位

正如我们在双重AMD EPYC 7251评论中指出的那样,AMD有许多竞争对手。明显的竞争对手是Intel Xeon单插座线。作为P系列的一部分,AMD还将CPU定位于低端双Intel CPU配置。我们也看到来自双AMD EPYC 7251和AMD EPYC CPU的竞争价格相同。

AMD EPYC 7351P诉Intel Xeon Silver

由于AMD EPYC 7351P的售价为750美元(虽然我们看到的街头售价略高于出版时的售价820美元左右),但它并没有直接与英特尔金牌CPU竞争,而是与Xeon Silver系列竞争。英特尔至强银4108的价格刚刚超过400美元,我们认为EPYC 7351P是该配置的重要竞争对手。同样,英特尔至强银4114是同样价格的单插槽英特尔至强银色选项。

关于Intel Xeon Silver 1P和2P配置与7351P的问题,需要考虑几个要点。首先,AMD平板电脑拥有更多的PCIe通道,128个。英特尔在英特尔至强银上有48个,尽管在双插槽配置(96x)中,您可以认为使用PCH确实可以有效地使用这些通道。其次是记忆容量。AMD EPYC 7351P可以处理16x DDR4-2666 DIMM(8通道)和高达2TB的内存。英特尔至强单元可在单插槽模式下处理多达12x DDR4-2400 DIMM和768GB内存,在双插槽配置中可处理两倍。第三是平台方面。英特尔至强可扩展有更多可用的平台选项,并且在Xeon可扩展平台上有一些更成熟的功能(例如NVMe热插拔/交换QuickAssist)AMD平台仍然需要赶上生态系统成熟度。

Tyan-Transport-SX-B8026T70AE24HR-Internal-No-Components.jpg


Tyan Transport SX B8026T70AE24HR EPYC系统内部无组件



关键词: AMD EPYC EPYC 7351P