服务器平台计算性能工具Linpack服务器性能测试利器_一_

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Linpack 性能测试基准
L inpack现在在国际上已经成为最流行 的用于测试高性能计算机系统浮点性能 的benchmark。通过利用高性能计算机,用 高斯消元法求解一元 N 次稠密线性代数 方程组的测试,评价高性能计算机的浮 点性能。
L inpack测试包括三类,L inpack100、 性能的一个重要指标就是计算峰值,例如 L inpack1000和HPL 。L inpack100求解规模为 浮点计算峰值,它是指计算机每秒钟能完
硬件准备
佳的性能。HPL 采用高斯消元法求解线性
准备硬件平台的配置,升级到最新的
方程组。当求解问题规模为N 时,浮点运 算次数为(2/3 * N3- 2*N2)。因此,只 要给出问题规模N,测得系统计算时间T,
BIOS、B M C等版本,调整对性能有影响的 参数设置。
软件准备
峰值 = 计算量(2/3 * N3- 2*N2)/计算
例如在内存容量为 4G 时,设置 N 为 22000较为合理,这样内存分配较为合理, 因此在 22000阶时,可能得到最大计算性 能值。
配置文件的编写
下面是 linpack运行的参数配置文件 的例子,其中包括一个参数。
∠计算的点数。原则上是计算的点数 越多,则会遍历多种计算的性能情况,更 能找到最好的性能点,但是点数越多则运 算时间越长。
以在不改变计算量的前提下进行算法和代
码优化。HPL 即 Hig h Perform ance L inpack, 也叫高度并行计算基准测试,它对数组大 小N没有限制,求解问题的规模可以改变,
理论浮点峰值=CPU主频×CPU每个时钟周 期执行浮点运算的次数×系统中CPU数目。
除基本算法(计算量)不可改变外,可以
实测浮点峰值是指L inpack测试值,也
采用其它任何优化方法。前两种测试运 就是说在这台机器上运行 L inpack测试程
行规模较小,已不适合现代计算机的发 序,通过各种调优方法得到的最优的测试 展,因此现在使用较多的测试标准为 结果。实际上在实际程序运行过程中,几
HPL ,而且阶次 N 也是 linpack测试必须指ቤተ መጻሕፍቲ ባይዱ乎不可能达到实测浮点峰值,更不用说达
可以编写一个shell的脚本文件,这样 可以灵活的控制运行的过程,运行结果的 记录等。例如下面的脚本文件的例子,先 设置系统内的对称多处理器的数目,在使 用参数设置文件的参数运行linpack,并把 结果输出到一个文本文件内。
# export OMP_NUM_THREADS=2 echo “This is a SAM P L E run script. Chang e it to reflect the correct num ber” echo “of CPUs/threads, problem in- put files, etc..” date date > lin_xeon32.txt ./xlinpack_xeon32 lininput_xeon32 >> lin_xeon32.txt date >> lin_xeon32.txt echo -n “Done: ” date
L inpack主要特色是: ∠率先开创了力学 (Mechanics) 分析 软件的制作。 ∠建立了将来数学软件比较的标准。 ∠提供软件链接库, 允许使用者加以 修正以便处理特殊问题, 当然程序名称必须 改写, 并应注明修改之处, 以尊重原作者, 并避免他人误用。 ∠兼顾了对各计算机系统的通用性, 并提供高效率的运算。 至目前为止, Linpack还是广泛地应用于 解各种数学和工程问题。 也由于它高效率的 运算,使得其它几种数学软件例如 IMSL 、 MATLAB 纷纷加以引用来处理矩阵问题, 所 以足见其在科学计算上有举足轻重的地位。
∠点数的分布。即设定几个不同的阶 数值,一般是在N附近的时候的阶数分布 较为密,以便找到最佳性能数据。
∠每个计算点的计算次数。为了减少 测试误差,增加每点的计算次数取其平均 值,得到比较可信的性能数据。
∠设置内存的对齐尺寸。内存分配的 时候的内存对齐方式,可以提高内存的读 取效率,提高性能测试结果,但设置过大 将产生一定的内存空间的浪费,一般为 4KB 或 8KB 。
to run a test 8 8 8 8 8 8 8 8 8 8 8 8 # alig nment values (in KBy tes)
运 行
Intel提供了基于IA架构平台优化后的 可执行版本3.0.1,不需下载源代码再通过 编译器,编译优化,因此使用起来比较简 单和方便。现在可以执行的平台见表2。
主 编/赵吉志
明的参数。
到理论浮点峰值了。这两个值只是作为衡
HPL 是针对现代并行计算机提出的测 量机器性能的一个指标,用来表明机器处
试方式。用户在不修改任意测试程序的 理能力的一个标尺和潜能的度量。
基础上,可以调节问题规模大小 N(矩阵 大小)、使用到的 CPU 数目、使用各种优
测试过程
化方法等来执行该测试程序,以获取最
结果查看
根据上面的运行脚本文件,运行结果 输出到文件 lin_xeon32.txt内。
性能测试举例
利用此工具对 NP370D产品做了计算 性能的测试,内存使用相同的4G容量,结 果见表3。
从测试数据看,w oodcrest处理器比 dempsey 的浮点计算能力有较大的提升, 通过后续的软硬件的参数的调优,平台的 计算能力还会不同程度的提升。
操作系统的准备。由于 OS 自身也会
时间T,测试结果以浮点运算每秒(Flops) 占用系统资源,因此一般会使用linux作为
给出。
linpack测试的 OS 平台,采用最新的内核
计算机计算峰值简介
版本的linux,这样可以充分的发挥出硬件 的新的特性,发挥出平台的计算性能;在
随着产品硬件的不断升级,整个计算 系统启动后,将一些没有必要的系统守护
产品技术
www.inspur.com
服务器平台
文|赵吉志
计算性能工具 Linpack
服务器性能测试利器(一)
计算机硬件的不断升级带来了系统处理性能的持续提高,如何对平台的性能作出正确的判断是性能测试的 主要目标。业界有多种测试基准,有的是基于实际的应用种类如 TPC - C,有的是测试系统某一部分的性能, 如测试硬盘吞吐能力的 IOmeter,测试内存带宽的 stream。本专题将对几个常见且权威的测试基准以及其使用 方法作一下介绍。
Linpack的起源及原始用途
L inpack是线性系统软件包(L inear sy stem packag e) 的缩写, 主要开始于 1974 年 4 月, 美国 Arg onne 国家实验室应用数学所 主任 J im Pool, 在一系列非正式的讨论会 中评估,建立一套专门解线性系统问题之 数学软件的可能性。 后来便提出了 L inpack 计划案送到国家科学基金会 (National Sci- ence Foundation ) 审核, 经国家科学基金会 同意并提供经费。
100阶的稠密线性代数方程组,它只允许 成的浮点计算最大次数。包括理论浮点峰
采用编译优化选项进行优化,不得更改代 值和实测浮点峰值。
码,甚至代码中的注释也不得修改。
理论浮点峰值是该计算机理论上能达
L inpack1000要求求解规模为 1000阶的线 到的每秒钟能完成浮点计算的最大次数,
性代数方程组,达到指定的精度要求,可 它主要是由 CPU的主频决定的。
下面是一个完整的配置文件的例子。 L INPACK data 12 # num ber of tests 1000 2000 5000 10000 15000 20000 25000 27000 28000 29000 30000 31000 # problem sizes 1000 2008 5008 10008 15000 20008 # leading dimensions
能力也以数量级的速度提升。衡量计算机 进程去掉,可以运行 ntsy sv命令,关闭除
21
——科 技 浪 潮 ——
了 irqbalance 和 m essag ebus.之外的系统 服务进程,也可以节省系统的资源;并且 将操作系统启动到第三级,不要进入图 形方式。
linpack的参数设置
运算阶数 N 的选择:由于在计算过程 中,会分配、占有一定的内存空间,因此 依据内存容量合适的设置 N 的数值,会得 到较为准确的计算性能数据。如果N设置 较小,内存不能充分利用,则处理能力不 能发挥;如果 N 设置较大,内存空间不能 满足需求,则需要经常执行硬盘读写,从 而会有处理器的等待时间,计算时间会延 长,测试到的计算性能结果也会受到影 响。根据内存容量大小,对应 N 的数值见 表1的参考关系。
相关文档
最新文档