高性能计算与高性能计算机
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
衡量系统性能的主要指标(2)
MFLOPS(百万次浮点运算每秒)
理论计算:系统的浮点计算部件每秒可以做的浮点计算 次数; MFLOPS = (number of Floating Point compute Unit)×N N为每个浮点计算部件一个周期内可以做的最多浮点操作 数,对于目前常见的微处理器,一般为1-4; 实际数值:对于一个应用,浮点运算数目与运行时间的 比值; MFLOPS’ = (number of floating operations) / (execution time)
所有处理器峰值速度之积 , R’peak为一个处理器的峰值速度 可达速度与峰值速度之比 传送0-字节或单字的时间
无量纲
Mflop/s 无量纲 Μs
渐近带宽
r∞
传送长消息通信速率
MB/s
衡量系统性能的主要指标(1)
MIPS(百万条指令每秒) 理论计算:处理器的时钟频率与平均每条指令所 需的时钟周期(Cycles Per Instruction)的比 值 MIPS = clock rate / CPI = (number of Instructions) / (CPU time) 实际数值:对于一个应用(程序),指令数目与 运行时间的比值 MIPS’= (number of Instructions) / (execution time)
大规模并行计算机系统(MPP)
• MPP
– 物理和逻辑上均是分布内存 – 能扩展至成百上千个处理器( 微处理器或向量处理器) – 采用高通信带宽和低延迟的互 联网络 (专门设计和定制的) – 一种异步的MIMD机器;程序系 由多个进程组成,每个都有其 私有地址空间,进程间采用传 递消息相互作用; – 代表:CRAY T3E(2048), ASCI Red(3072), IBM SP2, 曙光 1000
什么是高性能计算?
计算科学与传统的两种科学,即理论科学和实 验科学,并立被认为是人类认识自然的三大支 柱,他们彼此相辅相成地推动科学发展与社会 进步。在许多情况下,或者是理论模型复杂甚 至理论尚未建立,或者实验费用昂贵甚至无法 进行时,计算就成了求解问题的唯一或主要的 手段。
为什么要做高性能计算 ——应用需求
高性能计算与高性能计算机
总结
什么是高性能计算和高性能计算机
什么是集群(Cluster),怎么配臵集群 什么样的用户需要高性能计算机 高性能用户都关心哪些问题 高性能计算机销售和一般服务器销售的区别
提纲
高性能市场概要
曙光和高性能计算机 什么是高性能计算 什么是高性能计算机 集群系统
高性能计算机系统架构
并行向量机
SMP DSM(NUMA) MPP,节点可以是单处理器的节点,也可以是 SMP,DSM
Cluster
Constellation
高性能计算机的制造厂商
Cray
SGI IBM 曙光 银河
神威
并行计算机系统类型
Flynn分类:
高性能计算市场
一些厂商的表现
例如:Intel
技术的发展
CPU多核化的趋势 多进程、多线程并行化的 趋势 其他 并行计算机上的广泛应用 高端下移 … … …
国家的政策
自主创新
… … … 高性能计算的市场正处于发展阶段
提纲
高性能市场概要
曙光和高性能计算机 什么是高性能计算 什么是高性能计算机 集群系统
高性能计算市场
IDC对08年服务器市场的预测:
08年,全球服务器产业预计以接近9%的速度发展,HPC产业预 计的发展速度将会超过12% 在中国,HPC市场的发展速度将会超过20%
HPC市场既是一个传统的市场,又是一个新兴的、高速 发展的市场
高:定位高端用户 标杆项目,影响力大 平民化趋势 快速发展
计算所/曙光和高性能计算
2005年
2006年
2007年
提纲
高性能市场概要
曙光和高性能计算机 什么是高性能计算 什么是高性能计算机 集群系统
什么是高性能计算?
高性能计算
HPC:High Performance Compute
高性能计算---并行计算
并行计算(Parallel Computing) 高端计算(High-end Parallel Computing) 高性能计算(High Performance Computing) 超级计算(Super Computing)
两个指标的缺点
都不能全面表征系统的性能
MIPS指标比较适用于事务处理领域; 不同系统的指令不同,一条指令的功能和复杂度差别 很大, 如IBM的大型主机(Mainframe),价格达到 千万元的大型机(含配套软件),其MIPS值一般为5 -10,不及价值数千元的Pentium4 PC; 非计算密集型的应用(事务处理)对I/O要求高,计算 密集型的应用(图形程序)对主频要求高。用户对可 靠性等特殊要求; 应用的需求不同,高性能计算领域也是‚通才‛难求 ,各有所长; 某些特殊类型计算机适合特定的应用。
分布式共享存储系统(DSM)
• DSM
– 分布共享存储: 内存模块物理上局 部于各个处理器内部,但逻辑上(用 户)是共享存储的; 这种结构也称 为基于Cache目录的非一致内存访 问(CC-NUMA)结构;局部与远程内存 访问的延迟和带宽不一致,3-10倍 高性能并行程序设计注意; – 与SMP的主要区别:DSM在物理上有 分布在各个节点的局部内存从而形 成一个共享的存储器; – 微处理器: 16-128个,几百到千亿 次; – 代表: SGI Origin 2000, Cray T3D;
计算所/曙光和高性能计算
2001.10 曙光3000
每秒4032亿次 SUMA标准诞生
2003.3 曙光4000L
644个CPU,每秒3万亿次
2004.6 曙光4000A
2560颗CPU,每秒10万亿次 名列世界第十,成为除美日以外第 一个进入世界‚top500‛前10名的 国家
计算所/曙光和高性能计算
高性能计算机都在什么地方使用?都卖到哪儿 去?
国外状况 国内状况
提纲
高性能市场概要
曙光和高性能计算机 什么是高性能计算 什么是高性能计算机 集群系统
什么是高性能计算机?
由多个计算单元组成,运算速度快、存储容量大、 可靠性高的计算机系统。
也称为:巨型计算机、超级 计算机
目前任何高性能计算和超级 计算都离不开使用并行技术, 所以高性能计算机肯定是并 行计算机。
其发展历程可以简单的分为两个时代
专用时代
包括向量机,MPP系统,SGI NUMA 系统,SUN大型SMP系统,也包括我国的神 威,银河,曙光1000等。 之所以称为“专用”,并不是说它们只能运行某种应用,是指它们的组成部 件是专门设计的,它们的CPU板,内存板,I/O板,操作系统,甚至I/O系统, 都是不能在其它系统中使用的。由于技术上桌面系统与高端系统的巨大差异, 和用户群窄小。
中国登峰造极的最高性能的计算机系统 运算速度超过百万亿次的曙光5000,将使中国成为美国之后第二 个能生产百万亿次超级计算机的国家 曙光5000共采用3万颗CPU核,峰值230万亿次,Linpack效率 超过70% 曙光5000计算能力超过曙光4000A十多倍,而体积、功耗与曙光 4000A相同,代表了中国高性能计算机发展的最高水平
T1
Tn R n = W/T n Sn=T1/Tn
程序在单处理机上的运行时间
程序在并行机上的运行时间 每秒百万次浮点运算 衡量并行机有多快
s(秒)
s(秒) Mflop/s 无量纲
效率
峰值速度 利用率 通信延迟
En = S n/n
R peak = n R’ peak U =R n/R peak to
衡量处理器的利用率
多处理机 && 多计算机
多处理机 (共享存储) 多计算机
(分布式存储)
UMA:
NUMA:
NORMA:
并行计算机的性能指标
名 称 机器规模 时钟速率 工作负载 符 号 n f W 含 意 处理器的数目 时钟周期长度的倒数 计算操作的数目 单位 无量纲 MHZ Mflop
顺序执行时间
并行执行时间 速度 加速
现代高性能计算机都属于MIMD。MIMD从结构上 和访存方式上,又可以分为:
– 结构模型:PVP, SMP, MPP, DSM, COW – 访存模型:UMA, NUMA, COMA, CC-NUMA, NORMA
结构模型
对称多处理机系统(SMP)
• SMP
– 对称式共享存储:任意处理器 可直接访问任意内存地址,且 访问延迟、带宽、机率都是等 价的; 系统是对称的; – 微处理器: 一般少于64个; – 处理器不能太多, 总线和交叉 开关的一旦作成难于扩展; – 例子: IBM R50, SGI Power Challenge, SUN Enterprise, 曙光一号;
机群系统(Cluster)
• Cluster
– 每个节点都是一个完整的计算 机 – 各个节点通过高性能网络相互 连接 – 网络接口和I/O总线松耦合连 接 – 每个节点有完整的操作系统 – 曙光2000、 3000、4000, ASCI Blue Mountain
访存模型
NORMA: UMA:
NUMA:
SISD, SIMD, MIMD, MISD
结构模型:
PVP, SMP, MPP, DSM, COW
访存模型:
UMA, NUMA, COMA, CC-NUMA, NORMA
并行计算机分类
Flynn分类
Flynn(1972)提出指令流、数据流和多倍性概念,把不同的计算机分 为四大类: – SISD(Single-Instruction Single-Data) – SIMD(Single-Instruction Multi-Data) – MISD(Multi-Instruction Single-Data) – MIMD(Multi-Instruction Multi-Data)
多处理机(单地址空间共享存储器) UMA: NUMA: Uniform Memory Access Nonuniform Memory Access
多计算机(多地址空间非共享存储器) NORMA: No-Remote Memory Access
结构模型--访存模型
UMA: NUMA: NORMA:
计算所/曙光和高性能计算
1993.10 曙光一号
16个处理器,每秒6.4亿次
使中国成为少数能生产制造MPP的国家之一
1995.5 曙光1000
36个节点机,每秒25.6亿次
1998.12 曙光2000 I
68个节点机,每秒200亿次
2000.1 曙光2000 II
164个CPU,每秒1117亿次 中国第一个SMP集群
两个指标的缺点
理论计算和实际测试的差别
Biblioteka Baidu
为什么要做高性能计算
人类对计算及性能的要求是无止境的
从系统的角度:集成系统资源,以满足不断增长的对 性能和功能的要求 从应用的角度:适当分解应用,以实现更大规模或更 细致的计算
问题: 科学和工程问题的数值模拟与仿真
计算密集 数据密集 网络密集 三种混合
什么人需要高性能计算
普及时代
高性能计算机价格下降,应用门槛降低,应用开始普及。两个技术趋势起到 重要作用。 商品化趋势使得大量生产的商品部件接近了高性能计算机专有部件 标准化趋势使得这些部件之间能够集成一个系统中,其中X86处理器、以太网、 内存部件、Linux都起到决定性作用。 机群系统是高性能计算机的一种,它的技术基础和工业基础都是商品化和标 准化。
计算所/曙光和高性能计算
1956年成立,我国第一个计算技术研究所,被 誉为‚我国计算机事业的摇篮‛
第一台电子管计算机(103机) 第一台大型晶体管计算机(109机) 第一台大型集成电路计算机(111机) 第一台向量计算机(757机) 第一台大规模并行计算机(曙光1000) 被国防部门誉为‚功勋机‛ 109丙机,为两弹一星做 出过重要贡献