计算机系统结构第6章多指令流多数据流

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

COW的结点的网络接口NIC是松耦合到结点的I/O 总线上，而MPP的结点的NIC是紧耦合到结点的存储总线（MB）上
COW的每个结点驻留有一个完整的操作系统，而 MPP的每个结点中通常只驻留操作系统的微核
MIMD计算机访存模型

均匀存储访问模型（UMA Uniform Memory Biblioteka Baiduccess ) … P1 P2 Pn

非远程存储访问模型（NORMA NO-Remote Memory Access ）
M P M M P M P
…
M P P P M
P
消息传递互连网络（网络、环网、超立方、立方环等）
P M P M
…
…
M
…
P M
所有存储器都是私有的，仅能由本地存储器访问每个结点都是由处理器P、本地存储器M和（或）I/O设备组成的自治计算机，多个结点由基于消息传递的互连网络相连绝大多数NORMA都不支持远程存储器的访问

高速缓存一致性非均匀存储访问模型（CC-NUMA Cache-Coherent NonUniform Memory Access）
结点1
结点N
P/C
… P/C
M
P/C
… P/C
M
总线或交叉开关
总线或交叉开关 I/O NIC, DIR, RC
I/O
NIC, DIR, RC
系统互连网络
绝大多数商用CC-NUMA多处理机系统都使用基于目录的高速缓存一致性协议来维护Cache的一致性保留了SMP结构的易于编程的优点，同时也改善了常规SMP结构的可扩放性问题该模型实际上是一个分布共享存储（DSM）多处理机系统模型该模型最显著的优点是程序员无需明确地在结点上分配数据。由系统的硬件和软件自动对各结点分配数据，在程序运行期间，由高速缓存一致性硬件自动地将数据迁移到要使用它的地方
系统互连（总线，交叉开关，多级网络）
…
I/O SM1 SMm
物理存储器被所有处理器均匀共享，所谓均匀共享是指所有处理器访问任何存储器所需的时间均相同
每个处理器可带有私有高速缓存外围设备以一定的形式被共享由于高度共享资源而称为紧耦合系统

对称多处理机系统

所有处理机都能等同地访问所有I/O设备，能同样地运行执行程序只有一个或一组处理机能执行操作系统并能操纵 I/O，而其他处理器（称从处理器）只能在主处理器的监控之下执行用户代码，不能直接运行 I/O程序
对称性，即每个处理器可以等同地访问共享存储器、 I/O设备和操作系统服务由于对称，才能开拓较高的并行度
由于共享存储，限制了系统中的处理器不能太多，用于互连的总线或交叉开关也难以扩展

大规模并行处理机系统MPP
MB MB
P/C
LM NIC
P/C
…
LM NIC
定制网络
Intel Paragon、IBM SP2、Intel TFLOPS和我国的曙光-1000等
…
定制网络 Stanford DASH、Cray T3D和SGI Origin 2000
高速缓存目录DIR用于支持分布式高速缓存的一
致性
DSM的共享存储器是由物理的分布在各处理结点
中的本地存储器LM组成通过系统硬件和软件为用户提供一个单地址的编程空间

工作站机群
MB P/C M B LD IOB NIC MB P/C M
…
LD
B IOB NIC
商品网络（以太网、ATM等）
Berkeley NOW、Alpha Farm、Digital TruCluster 都属于工作站机群
COW的每个结点都是一个完整的工作站
各结点通过一种低成本的商品网络互连，例如，以太网、FDDI和ATM开关等 COW的每个结点内都有本地磁盘（LD），而MPP 的结点内没有LD
多指令流多数据流计算机
MIMD计算机结构模型

并行向量处理机PVP
VP VP
…
VP
交叉开关网络
SM
SM
…
SM
Cray C-90、Cray T-90、NEC SX4和我国的银河1号

对称多处理机系统SMP
P/C P/C
…
P/C
总线或交叉开关 SM SM
…
I/O
IBM R50、SGI Power Challenge、DEC Alpha服务器 8400和我国的曙光1号
处理结点采用商品微处理器系统中有物理分布的存储器采用高通信带宽和低延迟的互连网络系统的处理结点可以扩放到成百上千个处理器它是一种异步的MIMD机器，程序由多个进程组成，每个进程都有其私有地址空间，进程之间采用消息传递相互作用。

分布式共享存储系统DSM
MB P/C LM DIR NIC MB P/C LM DIR NIC

对称多处理机系统

对称多处理机的结构
P/C P/C … P/C
总线或交叉开关 SM SM … I/O

SMP结构的特点

对称性

系统中任何处理器都可以访问共享存储器的任何存储单元和I/O设备，且具有相同的访存时间共享存储器的所有存储单元都按单一地址空间编址

单一物理地址空间

只需要一个OS副本驻留在共享存储器中，OS可以按工作负载情况在多个处理器上调度进程，从而易于达到动态负载平衡和有效利用系统资源

非对称多处理机系统

非均匀存储访问模型（NUMA）
LM1
P1 P2 …
LM2
互连网络
…
LMn
Pn
被共享的存储器在物理上分布在所有的处理器中，所有本地存储器的集合组成全局地址空间处理器访问存储器所需的时间不相等每个处理器可带有私有高速缓存，外设也可以以某种形式共享

GSM
GSM
…
GSM
全局互连网络（GIN）
P P … P 群1 CIN
CSM CSM
…
P
CSM
CIN
…
P … P
CSM
…
CSM
CSM
群N

全高速缓存存储访问模型（COMA Cache-Only Memory Access）
互连网络
D
C P
D
C P
D
…
C P
各处理器结点中没有存储层次结构，全部高速缓存组成全局地址空间利用分布的高速缓存目录D对远程高速缓存进行访问 COMA中的高速缓存容量一般都大于二级高速缓存容量开始使用COMA时，数据可以任意分配到高速缓存C中，在运行过程中，数据将被迁移到使用该数据的处理器结点的高速缓存中