高性能计算解决方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高性能计算解决方案
概览
1.1 HPC概述
1
高性能计算系统概述
什么是高性能计算
以计算为目的,使用了很多处理器的单个计算机系统或者使用了多台计算机集群的计算系统和环境
高性能计算系统的架构演变
向量机
全球HPC系统主流架构(cluster和MPP)
2009-2013 TOP500 HPC系统架构
500 400
高性能计算机能耗问题越来越 突出
Top计算机的耗电量相当于一个中型城 市日常耗电量,Top500计算机仅有167 个出现在Green Top500榜单中
挑战
管理困难,缺乏直观的管理和流
程定义工具
生物基因测序的步骤很复杂,分支很 多,新计算任务的上线很耗时间,效 率低下。 ——中国某生物基因公司研究员
50
2007
电力
2008
冷却
2010
2011
2012
制造、楼层、空间
Source: Top500官网
Source: InterSect360
6
高性能计算系统的发展趋势
X86,Linux,刀片系统,高速网络占据主流
100%
Others 9 AMD X86
9% 10%
Others
5%
Others
34%
计算节点
交 换 模 块
主要应用场景
小型超算用户:例如普通大学超算中心、各部委科研所、各地 动画基地渲染农场等
储存节点
All In Chassis解决方案:高度融合高密计算、大容量存储和高带宽网络
13
All-In-Chassis 标准配置
机框
组件
机框
管理节点& 计算节点 加速节点 胖节点 存储节点
系统环境
Windows
Linux
CentOS
并行环境
编译开发环境
并行文件系统
操作系统
计算环境
系统部署
硬件资源
刀片 机架
+
GPGPU Phi 机架存储 机柜存储 固态存储 IB/10GE交换机 GE交换机
定制开发
计算
存储
网络
基础设施
模块化数据中心 集装数据中心
备份恢复
11
高性能计算解决方案交付形态
Chassis
电力和冷却占整体机房设施费用70%以上
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 37 40 37 44 40 28 29 26 23 32 37 22
27
28
5000
0 2008 2009 2010 2011 2012 2013
Top1计算机功耗 Top2计算机功耗 Top3计算机功耗
Application : 计算应用
Scalable File System: 集群存储
Middleware: 计算通信中间件
Development Tools: 开发工具
Operating System: 集群操作系统 Interconnect: 高速计算互联设备 Server: 节点服务器 Storage: 硬件存储设备
All In
Rack
All In
Room
All In
高效敏捷 统一管理 适配业务特征
高度集成 快速部署 一体化设计
按需部署 高效节能 节约投资
小型
12
中型
大型
All-In-Chassis:小型HPC系统解决方案
特性说明
12U 8/16/32刀片,单框64个至强处理器,浮点计算能力达16.5T FLOPS 单框12TB高性价比内存,虚拟化和大数据分析轻松应对 单框15.6Tbps背板带宽,数据库集群极速互连 支持InfiniBand QDR/FDR ,支持IB EDR演进 支持GPGPU辅助加速计算
扩容部署复杂,重复利用已有
投资困难
我们的超算平台要分好几期建设,扩 容很不方便 ,且部署复杂,费时费 力。 ——欧洲某高校超算中心主任
8
概览
1.2 华为All-in-one高性能计算解决方案
9
高性能计算解决方案示意图
模块化数据中心
集群管理 业务管理
管理节点
交换网络
IB/10GE交换机
GE交换机
IB/10GE 业务网络 GE管理监控网络
状态监控
• Job Scheduling: 作业调度
4
高性能计算系统的发展趋势
计算能力每年成倍增长 单位能耗计算能力快速提高
PFlop/s
1000.00 33.86 800.00 600.00 17.59 10.51 2.57 2010 2011 2012 2013 400.00 200.00 0.00
MPP
DSM
Cluster
300 200 100 0
1970-1980 1980-1990
1990-2000 2000~2013
Cluster MPP SMP (source:www.top500.org)
2
高性能计算系统的应用领域
CAE仿真
结构分析、流体分析、电磁场分析
动漫渲染
图像处理、高清视频、三维渲染
集装数据中心
刀片节点
机架
GPGPU
Phi
机架存储
机柜存储
固态存储
计算集群
10
存储集群
高性能计算解决方案全景图
行业应用
集群管理
高性能集群管理软件 CHESS PBS Works Bright Platform J H Scheduler 炫云
气象环境
石油勘探
科研教育
动漫渲染
CAE/CFD
生命科学
服务平台
物理化学
量子力学、分子力学、蒙特卡罗分析
高性能计算 应用领域
Leabharlann Baidu石油勘探
地震资料处理、地震资料解释、油藏模拟
生命科学
序列比对、分子对接、分子动力学
气象环境
中尺度、中长期预报、海洋、环境预报
3
高性能计算系统组成
• Cluster Management: 集群和资源管理 • Deployment Toolkit: 部署工具 • Change Management: 配置变更管理 • Health Monitoring:
Others
16%
75%
Linux
GE
43%
全球TOP 500 高性 能计算机的使用情况
50%
Intel X86
81%
95%
Blade
66%
IB
25%
41%
处理器
操作系统
构建方式
互联网络
7
高性能计算发展中遇到的挑战
应用计算量快速膨胀,对性能要 求越来越高
我们的渲染业务发展很快,对计算资 源的需求正在急剧膨胀 ——美国某媒体制作公司高管
MFlops/Watt
885.19 628.77
40.00 30.00 20.00 10.00 0.00 2009 1.76
330.80
2011
2012
2013
世界第一的超级计算机最大计算能力
TOP 500单位能耗计算能力
Source: Top500官网
5
高性能计算系统的发展趋势
计算功耗逐年增加
20000 15000 10000
概览
1.1 HPC概述
1
高性能计算系统概述
什么是高性能计算
以计算为目的,使用了很多处理器的单个计算机系统或者使用了多台计算机集群的计算系统和环境
高性能计算系统的架构演变
向量机
全球HPC系统主流架构(cluster和MPP)
2009-2013 TOP500 HPC系统架构
500 400
高性能计算机能耗问题越来越 突出
Top计算机的耗电量相当于一个中型城 市日常耗电量,Top500计算机仅有167 个出现在Green Top500榜单中
挑战
管理困难,缺乏直观的管理和流
程定义工具
生物基因测序的步骤很复杂,分支很 多,新计算任务的上线很耗时间,效 率低下。 ——中国某生物基因公司研究员
50
2007
电力
2008
冷却
2010
2011
2012
制造、楼层、空间
Source: Top500官网
Source: InterSect360
6
高性能计算系统的发展趋势
X86,Linux,刀片系统,高速网络占据主流
100%
Others 9 AMD X86
9% 10%
Others
5%
Others
34%
计算节点
交 换 模 块
主要应用场景
小型超算用户:例如普通大学超算中心、各部委科研所、各地 动画基地渲染农场等
储存节点
All In Chassis解决方案:高度融合高密计算、大容量存储和高带宽网络
13
All-In-Chassis 标准配置
机框
组件
机框
管理节点& 计算节点 加速节点 胖节点 存储节点
系统环境
Windows
Linux
CentOS
并行环境
编译开发环境
并行文件系统
操作系统
计算环境
系统部署
硬件资源
刀片 机架
+
GPGPU Phi 机架存储 机柜存储 固态存储 IB/10GE交换机 GE交换机
定制开发
计算
存储
网络
基础设施
模块化数据中心 集装数据中心
备份恢复
11
高性能计算解决方案交付形态
Chassis
电力和冷却占整体机房设施费用70%以上
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 37 40 37 44 40 28 29 26 23 32 37 22
27
28
5000
0 2008 2009 2010 2011 2012 2013
Top1计算机功耗 Top2计算机功耗 Top3计算机功耗
Application : 计算应用
Scalable File System: 集群存储
Middleware: 计算通信中间件
Development Tools: 开发工具
Operating System: 集群操作系统 Interconnect: 高速计算互联设备 Server: 节点服务器 Storage: 硬件存储设备
All In
Rack
All In
Room
All In
高效敏捷 统一管理 适配业务特征
高度集成 快速部署 一体化设计
按需部署 高效节能 节约投资
小型
12
中型
大型
All-In-Chassis:小型HPC系统解决方案
特性说明
12U 8/16/32刀片,单框64个至强处理器,浮点计算能力达16.5T FLOPS 单框12TB高性价比内存,虚拟化和大数据分析轻松应对 单框15.6Tbps背板带宽,数据库集群极速互连 支持InfiniBand QDR/FDR ,支持IB EDR演进 支持GPGPU辅助加速计算
扩容部署复杂,重复利用已有
投资困难
我们的超算平台要分好几期建设,扩 容很不方便 ,且部署复杂,费时费 力。 ——欧洲某高校超算中心主任
8
概览
1.2 华为All-in-one高性能计算解决方案
9
高性能计算解决方案示意图
模块化数据中心
集群管理 业务管理
管理节点
交换网络
IB/10GE交换机
GE交换机
IB/10GE 业务网络 GE管理监控网络
状态监控
• Job Scheduling: 作业调度
4
高性能计算系统的发展趋势
计算能力每年成倍增长 单位能耗计算能力快速提高
PFlop/s
1000.00 33.86 800.00 600.00 17.59 10.51 2.57 2010 2011 2012 2013 400.00 200.00 0.00
MPP
DSM
Cluster
300 200 100 0
1970-1980 1980-1990
1990-2000 2000~2013
Cluster MPP SMP (source:www.top500.org)
2
高性能计算系统的应用领域
CAE仿真
结构分析、流体分析、电磁场分析
动漫渲染
图像处理、高清视频、三维渲染
集装数据中心
刀片节点
机架
GPGPU
Phi
机架存储
机柜存储
固态存储
计算集群
10
存储集群
高性能计算解决方案全景图
行业应用
集群管理
高性能集群管理软件 CHESS PBS Works Bright Platform J H Scheduler 炫云
气象环境
石油勘探
科研教育
动漫渲染
CAE/CFD
生命科学
服务平台
物理化学
量子力学、分子力学、蒙特卡罗分析
高性能计算 应用领域
Leabharlann Baidu石油勘探
地震资料处理、地震资料解释、油藏模拟
生命科学
序列比对、分子对接、分子动力学
气象环境
中尺度、中长期预报、海洋、环境预报
3
高性能计算系统组成
• Cluster Management: 集群和资源管理 • Deployment Toolkit: 部署工具 • Change Management: 配置变更管理 • Health Monitoring:
Others
16%
75%
Linux
GE
43%
全球TOP 500 高性 能计算机的使用情况
50%
Intel X86
81%
95%
Blade
66%
IB
25%
41%
处理器
操作系统
构建方式
互联网络
7
高性能计算发展中遇到的挑战
应用计算量快速膨胀,对性能要 求越来越高
我们的渲染业务发展很快,对计算资 源的需求正在急剧膨胀 ——美国某媒体制作公司高管
MFlops/Watt
885.19 628.77
40.00 30.00 20.00 10.00 0.00 2009 1.76
330.80
2011
2012
2013
世界第一的超级计算机最大计算能力
TOP 500单位能耗计算能力
Source: Top500官网
5
高性能计算系统的发展趋势
计算功耗逐年增加
20000 15000 10000