如何设计一个高性能计算机档
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何设计一个高性能计算机
1.要设计一个高性能计算机,首先我们得了解计算机的基本组成,运算以及运行方式。
计算机的基本组成:输入设备,存储器,运算器,控制器,输出设备
基本计算模式:
主机/终端, 客户机/服务器,服务器聚集,网格计算,云计算。
2.了解计算的基本组成后我们还要知道高性能计算机的概念,从而从一个基本计算机身上,设计出一个高性能计算机。
高性能计算机及分类,实现高性能的途径-并行
平衡性, 局部性, 周期隐藏
SISD, SIMD, MIMD, MISD, SPMD
指令级并行, VLIW, EPIC
流水线, 向量机, PVP, 数组处理机
SMP, 紧偶合, 共享存储, Cache 一致性
MPP, 机群,松散偶合, 分布式存储
ccNUMA, 计算资源虚拟化
3.获得高性能的途径
提高部件性能极其限度: CPU, 内存, 磁盘, 网络
并行处理, 设计优化, 性能优化
开发局部性: 空间局部性, 时间局部性
并行性与局部性的矛盾
周期隐藏
(1)计算机--从串行到并行
基本的串行计算机结构
(CPU)
4.高性能计算机分类
基于体系结构的分类
基于访存模式的分类
基于指令流/数据流的分类
1,机群系统:
IA + Linux/NT: 联想深腾1800 系列,性价比高
RISC + Unix: IBM sp 系列,性价比低
2,UNIX SMP 小型机:IBM 690,SUN,
商务计算为主, 易编程,可扩展性差
3,(传统)大规模并行机(mpp):T3E,曙光1000
编程不易,曾停止发展
Cray XT系列的Red Storm 重新抬头, TOP10, 原因: 大规模时体积小
4,向量机(传统超级机):CRAY, 银河I
不再单独发展
5,向量并行机:NEC地球模拟器, Cray X1
速度高,效率高, 昂贵,专用,非产品化
在世界TOP500份额居第二
6, ccNUMA:SGI Qrigin3000, Altix3000
兼顾可扩展性和可编程性
7,专用机:IBM BlueGene, BlueGen/L
解决规模(速度)和体积功耗矛盾
5.分类基于指令流/数据流的体系结构
指令流(程序流)/数据流并行
单指令流单数据流(SISD): 单CPU计算机
单指令流多数据流(SIMD):数组处理计算机
多指令流单数据流(MISD:栈计算机(无实用机)
多指令流多数据流(MIMD):MPP, cluster
SPMD: 单程序/多数据流, MPP, cluster
MPMD: 多程序流/多数据流, 高吞吐(事务处理)
6.CPU 芯片发展趋势
CPU 芯片最终收敛到两家:Intel, IBM
理由:市场规模决定芯片生存
现实:志强/安腾赶上/超过RISC芯片,单
CPU 速度达到每秒100亿次
IBM 采用铜连线、绝缘衬底、Low k 技术
Power6速度超过80亿次/秒
HP/Compaq向INTEL 靠拢,Alpha 停止发展
SUN:采用志强
SGI:放弃MIPS, 采用IA64做Altix 服务器
最终趋势:IA 和RS6000(IBM Power) 存在和发展
流水线与向量机
7.流水线与向量机
流水线: pipelines
向量处理机: vector processor, 并行向量处理机(PVP)
数组处理机: array processor
内存访问流水线
消息传递流水线(/message queue)
8.网络计算模式
1,主机(mainframe)/终端(1980年代中期年以前)
直接I/O连接或互连网连接
效率高,
开放性,扩充性差,技术复杂
2, 客户机/服务器(client/server)(1980年代后期以来)
基于局域网(LAN)或广域网(W AN)
开放、可扩充
难管理
总拥有成本(TCO)高
3.大规模并行处理系统结构设计规范
系统设计目标: 浮点速度, 字长, 内存总容量, 磁盘总容量,
点-点通信带宽, 等分带宽(bi-section) ,
可扩展性, 系统均衡性
系统结构: 可扩展分布式(共享?)存储, MIMD/SPMD
结点机: 单/SMP, CPU种类与主频, cache, 内存, I/O接口
互连网络: 高速网: mesh(2D/3D), Tree, nCUBE; 以太网
结点-网络接口: 与高速网对应, 单/双卡, 带宽
9.当了解了计算机与高性能计算机的原理与技术的时候,我们就可根据这些理论来进行设计一个高性能计算机。
1.大规模并行处理系统结构设计规范
(1)系统设计目标: 浮点速度, 字长, 内存总容量, 磁盘总容量,
点-点通信带宽, 等分带宽(bi-section) ,
可扩展性, 系统均衡性
(2)系统结构: 可扩展分布式(共享?)存储, MIMD/SPMD
(3)结点机: 单/SMP, CPU种类与主频, cache, 内存, I/O接口
(4)互连网络: 高速网: mesh(2D/3D), Tree, nCUBE; 以太网
(5)结点-网络接口: 与高速网对应, 单/双卡, 带宽
2.大规模并行处理系统结构设计规范(续
(1)I/O: 专用/通用结点机, PCI/专用通道, SAN/NAS
外部网络连接: 前端机/客户机
操作系统:
结点OS(Unix/Linux/WindowsNT),
并行OS (active message ), 实/虚存, 并行文件系统
(2)使用模式: 批处理/交互式, 独占/多用户, client/server,
直接login, 远程host, 网格
(3)并行编程环境: 并行优化编译, 库函数, 调试器,
PVM/MPI, HPF
(4)可视化工具: 并行程序运行可视化, 运行结果可视化
3.MPP结构设计规范实例
系统设计目标:
浮点速度: 25.6亿次/秒, 32CPU(计算)
内存总容量: 1024MB, 磁盘总容量: 5GB
点—点通信带宽: 80MB/秒(双); 等分带宽:480MBS