云计算中的HPC高性能计算

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.背景:

云计算的优势

共享的计算设备

多租户的使用模型

可高度适配的资源分配

按需定制的HPC环境开始流行

2.挑战

虚拟化的开销

CPU, 内存, 驱动等

通信网络的区别

万兆以太网vs. Infiniband

并行IO的配置选项

设备, 文件系统和IO库的选择

3.CCI: Amazon的HPC解决方案

4. 虚拟化对HPC的影响

虚拟设备和物理设备有巨大的性能差别

虚拟机并没有引入很大的开销

对于直接分配给客户机的千兆网卡结论如此, 我们正在研究万兆网卡和IB 网卡的性能结果

5. 性能评价——结论

本地集群在通信上有巨大优势

对于CPU和内存密集型程序,CCI的性能和本地集群相似

究竟使用云还是本地集群,需要研究二者的性价比

6. I/O系统的可配置性:背景

I/O是很多高性能应用程序的性能瓶颈

应用程序的读写密集和并发度差别较大

传统高性能平台只提供通用的、统一的I/O系统

一些高性能程序开始考虑向云计算平台迁移

云计算平台可以带来I/O系统的高可配性

完全受控的虚拟机环境,自定义配置成为可能

弹性的资源申请和方便的部署方式

可选多种存储资源进行搭配

I/O系统的可配置性在于

可以在虚拟集群上选择不同的文件系统

可以利用多种底层存储设备进行组合

可以充分调节文件系统参数,专门为特定的某一个高性能应用程序进行配置 I/O系统可配置性的挑战

最优配置需要根据不同应用程序进行选择

需要平衡性能和总成本

7. I/O系统的可配置性:文件系统

网络文件系统(NFS)

使用简单,只有POSIX系统调用接口

对I/O需求较低的应用程序已经足够

存在单点瓶颈,扩展性差

并行文件系统(如PVFS)

MPI-IO接口,对并行读写支持良好

可以使用更多的IO节点,扩展性好

8. I/O系统的可配置性:存储设备、

单实例临时存储设备(Ephemeral)

块设备,每节点2*800 GB, 非持久化存储

弹性块设备(EBS)

每个实例可挂载任意多块,可跨实例挂载

持久化,生命期与虚拟机实例无关

云端数据库存储服务(S3)

键值存储,面向数据库和互联网应用

9. I/O系统的可配置性:文件系统参数

10. I/O系统的可配置性:结论

针对不同的HPC应用配置I/O系统很有必要

不同HPC应用对I/O的需求不一样

性能和价格需要折中

I/O配置的挑战

应用的I/O行为决定了系统参数的选择

领域专家对文件系统知识缺乏,缺少经验

自动化的IO优化配置是有实际意义的

11.结论

高端处理器让HPC的云计算变得更加现实

虚拟化的低开销可以忍受

对于计算密集型的HPC程序,使用类似于CCI的计算平台值得投资 万兆网卡仍然会限制通信密集程序的性能和性价比

可配置性是云端待发掘的巨大优势之一

e.g. IO子系统

相关文档
最新文档