高密度科学计算系统与服务器区别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高密度计算系统与服务器的区别
1、应用场景--科学计算
科学计算周转时间长、计算量大的特点,科研现实模拟计算,周转时间经常超过1周,甚至几月,占用数十CPU核的计算任务。支撑科学计算的计算机系统需要具备以下的特性:硬件处理能力(有多少核可以并行)、并行效率(每个核持续CPU利用率)、持续稳定性。
2、Blackhole高密度计算系统与服务器硬件对比
a)架构设计:
●服务器就是为网络服务而设计的,任务必然是非连续的多任务密
集的运行特点,因此瓶颈是I/O的吞吐能力,因此运行时CPU利用
率根本无法达到40%以上,OS设计也是基于多任务特点,满足良好
的用户感受,导致处理器的部分处于闲置等待。
●Blackhole高密度计算系统为满足高密度科学计算设计,解决了
其中单一任务运行的瓶颈,使得持续CPU利用率在90%以上。
b)持续稳定性:
●服务器设计是为多任务服务,功耗大部分在650W以上,服务器
的多功能造成了系统的高功耗,产生了大量的运行热量,由于发热
会出现不稳定现象,导致模型需要重新计算。
●Blackhole高密度计算机,32核系统功耗仅仅控制在260W,发
热大大减少,稳定性极高,专门为科学计算服务,满足持续满负荷
计算要求。
c)静音:
●服务器运行噪音在40分贝左右,主要的噪音来源在于散热系统。
●Blackhole高密度计算机,在发热和散热系统的控制,运行噪音
在20-30分贝,非常有利于桌面运行。
3、Blackhole高密度计算系统与服务器软件服务对比
a)系统优化
●服务器是通用产品,不针对特定软件进行优化,这样导致硬件设
计的性能无法有效地为专门科学计算软件服务。
●Blackhole高密度计算系统通过专用应用系统优化OS软件,确保
并行的所有CPU持续效率>90%。
b)系统安装
●服务器厂商一般负责硬件系统的安装,不负责科学计算软件的安
装和调试。
●Blackhole高密度计算系统提供专门科学计算软件的安装和调
试。
4、Blackhole高密度计算系统与服务器扩展性对比
a)服务器仅仅关注硬件本身,未考虑后续的扩展并行需求。未经过系统的设计与优化,核数越多,并行效率越低。因此物理上简单的增加计算机节点并不能直接提升系统的处理能力,甚至会导致更差的结果,即一个节点故障有可能全部无法使用,
b)我们研究中心提供的大型计算机(中心)的设计结构,未来贵单位需要不断扩大计算能力,就采用简单增加节点机器的方法,将新机器并入该系统控制机的控制域即可进行合并的并行计算,同样实现单一系统映像,解决大型计算机系统的建设难以多机联合并行的主要问题。
5、附录--其他单位品牌机器容易出现的问题
a)清华大学陶瓷国家重点实验室
2011年8月由冯博士建立的2个模型:60原子MScastep Geometry optimize模型和28原子模型在该实验室128核刀片计算机上计算测试结果分别为:约120小时和58小时;这两个模型提交CNROCK
BLACKHOLE2平台48核计算时间分别为:48分钟和11分钟,直接提高效率约200倍,现在该刀片计算机已经基本不用。
b)上海大学材料学院
国内知名厂家刀片服务器,有10个计算节点,共计120核CPU。
问题:系统不稳定导致模型只能在1-2个计算节点上进行计算,计算周期非常长,最长需要1个多月才能出计算结果。
c)中国科学院工程热物理研究所
国内知名厂家刀片服务器,有8个计算节点。
问题:只能在1个计算节点上进行计算,导致计算周期非常长,最长的需要1个月才能出计算结果。
d)盐城工学院
机器厂家:国内知名厂家刀片服务器,有24个计算节点,300多CPU 核。问题:系统不稳定,无法提交任务。