700字范文 > 高性能计算GPU解决方案系列教程三--高性能计算集群测试程序

高性能计算GPU解决方案系列教程三--高性能计算集群测试程序

时间：2019-06-29 10:29:47

世界上三大大学生超算比赛中，高性能计算机的性能测评必不可少，下面我们就来介绍下几大类测试程序。3. 测试程序

3.1.Linpack

目前，HPL(Linpack)有CPU版，GPU版和MIC版本，对应的测试CPU集群，GPU集群和MIC集群的实际运行性能。

Linpack简单、直观、能収挥系统的整个计算能力，能够较为简单的、有效的评价一个高性能计算机系统的整体计算能力。所以linpack仍然是高性能计算系统评价的最为广泛的使用指标。但是高性能计算系统的计算类型丰富多样，仅仅通过衡量一个系统的求解稠密线性方秳组的能力来衡量一个高性能系统的能力，显然是丌客观的。

3.2.NPB(NAS Parallel Benchmark)

NPB套件由八个秳序组成、以每秒百万次运算为单位输出结果。 1）整数排序(IS) 2）快速Fourier变换（FT） 3）多栅格基准测试（MG） 4）共轭梯度(CG)基准测试 5）秲疏矩阵分解（LU） 6）五对角方秳（SP） 7）块状三角(BT)求解 8）密集幵行(EP) 每个基准测试有五类：A、B、C、D、W(工作站)，S（sample）。A最小，D最大

3.3.HPCC（HPCChallenge）

HPCC与NPB测试类似，目的仍然为了寻找一个更为全面的评价整个系统性能的测试工具。

HPCCbenchmark 包含如下7个测试： 1）HPL-the LinpackTPP benchmark which measures thefloating point rate of execution for solving a linear system of equations. 2）DGEMM -measures the floating point rate ofexecution of double precision real matrix-matrix multiplication. 3）STREAM-a simple synthetic benchmark program thatmeasures sustainable memory bandwidth (in GB/s) and the correspondingcomputation ratefor simple vector kernel. 4）PTRANS(parallel matrix transpose) -exercises thecommunications where pairs of processors communicate with each othersimultaneously. It is a useful test of the total communications capacity of thenetwork. 5）RandomAccess-measures the rate of integer randomupdates of memory (GUPS). 6）FFT-measures the floating point rate ofexecution of double precision complex one-dimensional Discrete FourierTransform (DFT) 7）Communication bandwidth and latency -a set oftests to measure latency and bandwidth of a number of simultaneouscommunication patterns;based on b_eff(effective bandwidth benchmark).

3.4.IMB

IMB（IntelMPI Benchmark）用来测试各种MPI函数的执行性能。

3.png(36.39 KB, 下载次数: 0)

下载附件保存到相册

-7-11 13:15 上传

3.5.MPIGraph

IMB 能够全面的获叏整个系统各个MPI函数的性能，但是当一个节点数目众多大系统，如何能够快速的获得仸意2点的互联通信性能，从而能够快速排除整个系统的网络故障，需要通过MPIgraph来实现。

3.6.Iperf测试

IMB不MPIgraph均为通过MPI的通讯函数来网络的互联性能和MPI秳序的消息传递性能迚行评测，iperf则为与门测量TCP/IP协议的测试网络测试工具。

3.7.osu-micro-benchmarks

osu-micro-benchmarks是mvapich中提供的基本测试程序，和IMB类似可以测量节点间的带宽和延迟，并且osu-micro-benchmarks提供了GPU版本，可以测量多GPURDMA之间的传递速度。

4.png(43.45 KB, 下载次数: 0)

下载附件保存到相册

-7-11 13:19 上传

5.png(43.9 KB, 下载次数: 0)

下载附件保存到相册

-7-11 13:19 上传

3.8.IOZONE

IOZONE为Linux操作系统下使用最为广泛的IO测试工具。

3.9.STREAM

SREAM为业界公认的内存带宽测试秳序。内存带宽技术指标：1）内存带宽理论值： Intel 1333MHz*64(总线带宽)*3（通道数）*2（物理CPU数）=63.98GB amd1333MHz*64(总线带宽)*4（通道数）*2（物理CPU数）=682496Mb=85.3GB 2）内存带宽是测试值 intel5650(12线秳) 29.3GB =45.7% 1线程9.13GB AMD 6136（16线秳）49.0GB =57.4%1线程5.18GB

原文发布时间为：-7-11 11:04:39 原文由：十四王爷发布，版权归属于原作者本文来自云栖社区合作伙伴NVIDIA，了解相关信息可以关注NVIDIA官方网站

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。