高密度科学计算系统与服务器区别

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高密度计算系统与服务器的区别

1、应用场景--科学计算

科学计算周转时间长、计算量大的特点,科研现实模拟计算,周转时间经常超过1周,甚至几月,占用数十CPU核的计算任务。支撑科学计算的计算机系统需要具备以下的特性:硬件处理能力(有多少核可以并行)、并行效率(每个核持续CPU利用率)、持续稳定性。

2、Blackhole高密度计算系统与服务器硬件对比

a)架构设计:

●服务器就是为网络服务而设计的,任务必然是非连续的多任务密

集的运行特点,因此瓶颈是I/O的吞吐能力,因此运行时CPU利用

率根本无法达到40%以上,OS设计也是基于多任务特点,满足良好

的用户感受,导致处理器的部分处于闲置等待。

●Blackhole高密度计算系统为满足高密度科学计算设计,解决了

其中单一任务运行的瓶颈,使得持续CPU利用率在90%以上。

b)持续稳定性:

●服务器设计是为多任务服务,功耗大部分在650W以上,服务器

的多功能造成了系统的高功耗,产生了大量的运行热量,由于发热

会出现不稳定现象,导致模型需要重新计算。

●Blackhole高密度计算机,32核系统功耗仅仅控制在260W,发

热大大减少,稳定性极高,专门为科学计算服务,满足持续满负荷

计算要求。

c)静音:

●服务器运行噪音在40分贝左右,主要的噪音来源在于散热系统。

●Blackhole高密度计算机,在发热和散热系统的控制,运行噪音

在20-30分贝,非常有利于桌面运行。

3、Blackhole高密度计算系统与服务器软件服务对比

a)系统优化

●服务器是通用产品,不针对特定软件进行优化,这样导致硬件设

计的性能无法有效地为专门科学计算软件服务。

●Blackhole高密度计算系统通过专用应用系统优化OS软件,确保

并行的所有CPU持续效率>90%。

b)系统安装

●服务器厂商一般负责硬件系统的安装,不负责科学计算软件的安

装和调试。

●Blackhole高密度计算系统提供专门科学计算软件的安装和调

试。

4、Blackhole高密度计算系统与服务器扩展性对比

a)服务器仅仅关注硬件本身,未考虑后续的扩展并行需求。未经过系统的设计与优化,核数越多,并行效率越低。因此物理上简单的增加计算机节点并不能直接提升系统的处理能力,甚至会导致更差的结果,即一个节点故障有可能全部无法使用,

b)我们研究中心提供的大型计算机(中心)的设计结构,未来贵单位需要不断扩大计算能力,就采用简单增加节点机器的方法,将新机器并入该系统控制机的控制域即可进行合并的并行计算,同样实现单一系统映像,解决大型计算机系统的建设难以多机联合并行的主要问题。

5、附录--其他单位品牌机器容易出现的问题

a)清华大学陶瓷国家重点实验室

2011年8月由冯博士建立的2个模型:60原子MScastep Geometry optimize模型和28原子模型在该实验室128核刀片计算机上计算测试结果分别为:约120小时和58小时;这两个模型提交CNROCK

BLACKHOLE2平台48核计算时间分别为:48分钟和11分钟,直接提高效率约200倍,现在该刀片计算机已经基本不用。

b)上海大学材料学院

国内知名厂家刀片服务器,有10个计算节点,共计120核CPU。

问题:系统不稳定导致模型只能在1-2个计算节点上进行计算,计算周期非常长,最长需要1个多月才能出计算结果。

c)中国科学院工程热物理研究所

国内知名厂家刀片服务器,有8个计算节点。

问题:只能在1个计算节点上进行计算,导致计算周期非常长,最长的需要1个月才能出计算结果。

d)盐城工学院

机器厂家:国内知名厂家刀片服务器,有24个计算节点,300多CPU 核。问题:系统不稳定,无法提交任务。

相关文档
最新文档