计算机系统结构第6章多指令流多数据流
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
COW的结点的网络接口NIC是松耦合到结点的I/O 总线上,而MPP的结点的NIC是紧耦合到结点的存 储总线(MB)上
COW的每个结点驻留有一个完整的操作系统,而 MPP的每个结点中通常只驻留操作系统的微核
MIMD计算机访存模型
均匀存储访问模型(UMA Uniform Memory Biblioteka Baiduccess ) … P1 P2 Pn
非远程存储访问模型(NORMA NO-Remote Memory Access )
M P M M P M P
…
M P P P M
P
消息传递互连网络 (网络、环网、超立方、 立方环等)
P M P M
…
…
M
…
P M
所有存储器都是私有的,仅能由本地存储 器访问 每个结点都是由处理器P、本地存储器M和 (或)I/O设备组成的自治计算机,多个结 点由基于消息传递的互连网络相连 绝大多数NORMA都不支持远程存储器的访 问
高速缓存一致性非均匀存储访问模型 (CC-NUMA Cache-Coherent NonUniform Memory Access)
结点1
结点N
P/C
… P/C
M
P/C
… P/C
M
总线或交叉开关
总线或交叉开关 I/O NIC, DIR, RC
I/O
NIC, DIR, RC
系统互连网络
绝大多数商用CC-NUMA多处理机系统都使用基 于目录的高速缓存一致性协议来维护Cache的一 致性 保留了SMP结构的易于编程的优点,同时也改善 了常规SMP结构的可扩放性问题 该模型实际上是一个分布共享存储(DSM)多处 理机系统模型 该模型最显著的优点是程序员无需明确地在结点 上分配数据。由系统的硬件和软件自动对各结点 分配数据,在程序运行期间,由高速缓存一致性 硬件自动地将数据迁移到要使用它的地方
系统互连 (总线,交叉开关,多级网络)
…
I/O SM1 SMm
物理存储器被所有处理器均匀共享,所谓均匀共享 是指所有处理器访问任何存储器所需的时间均相同
每个处理器可带有私有高速缓存 外围设备以一定的形式被共享 由于高度共享资源而称为紧耦合系统
对称多处理机系统
所有处理机都能等同地访问所有I/O设备,能同 样地运行执行程序 只有一个或一组处理机能执行操作系统并能操纵 I/O,而其他处理器(称从处理器)只能在主处 理器的监控之下执行用户代码,不能直接运行 I/O程序
对称性,即每个处理器可以等同地访问共享存储器、 I/O设备和操作系统服务 由于对称,才能开拓较高的并行度
由于共享存储,限制了系统中的处理器不能太多, 用于互连的总线或交叉开关也难以扩展
大规模并行处理机系统MPP
MB MB
P/C
LM NIC
P/C
…
LM NIC
定制网络
Intel Paragon、IBM SP2、Intel TFLOPS和我国的曙光-1000等
…
定制网络 Stanford DASH、Cray T3D和SGI Origin 2000
高速缓存目录DIR用于支持分布式高速缓存的一
致性
DSM的共享存储器是由物理的分布在各处理结点
中的本地存储器LM组成 通过系统硬件和软件为用户提供一个单地址的编 程空间
工作站机群
MB P/C M B LD IOB NIC MB P/C M
…
LD
B IOB NIC
商品网络(以太网、ATM等)
Berkeley NOW、Alpha Farm、Digital TruCluster 都属于工作站机群
COW的每个结点都是一个完整的工作站
各结点通过一种低成本的商品网络互连,例如,以 太网、FDDI和ATM开关等 COW的每个结点内都有本地磁盘(LD),而MPP 的结点内没有LD
多指令流多数据流计算机
MIMD计算机结构模型
并行向量处理机PVP
VP VP
…
VP
交叉开关网络
SM
SM
…
SM
Cray C-90、Cray T-90、NEC SX4和我国的银河1号
对称多处理机系统SMP
P/C P/C
…
P/C
总线或交叉开关 SM SM
…
I/O
IBM R50、SGI Power Challenge、DEC Alpha服务器 8400和我国的曙光1号
处理结点采用商品微处理器 系统中有物理分布的存储器 采用高通信带宽和低延迟的互连网络 系统的处理结点可以扩放到成百上千个处理器 它是一种异步的MIMD机器,程序由多个进程组成, 每个进程都有其私有地址空间,进程之间采用消息 传递相互作用。
分布式共享存储系统DSM
MB P/C LM DIR NIC MB P/C LM DIR NIC
对称多处理机系统
对称多处理机的结构
P/C P/C … P/C
总线或交叉开关 SM SM … I/O
SMP结构的特点
对称性
系统中任何处理器都可以访问共享存储器的任何存储 单元和I/O设备,且具有相同的访存时间 共享存储器的所有存储单元都按单一地址空间编址
单一物理地址空间
只需要一个OS副本驻留在共享存储器中,OS可以按工 作负载情况在多个处理器上调度进程,从而易于达到 动态负载平衡和有效利用系统资源
非对称多处理机系统
非均匀存储访问模型(NUMA)
LM1
P1 P2 …
LM2
互 连 网 络
…
LMn
Pn
被共享的存储器在物理上分布在所有的处理器中, 所有本地存储器的集合组成全局地址空间 处理器访问存储器所需的时间不相等 每个处理器可带有私有高速缓存,外设也可以以 某种形式共享
GSM
GSM
…
GSM
全局互连网络(GIN)
P P … P 群1 CIN
CSM CSM
…
P
CSM
CIN
…
P … P
CSM
…
CSM
CSM
群N
全高速缓存存储访问模型 (COMA Cache-Only Memory Access)
互连网络
D
C P
D
C P
D
…
C P
各处理器结点中没有存储层次结构,全部 高速缓存组成全局地址空间 利用分布的高速缓存目录D对远程高速缓 存进行访问 COMA中的高速缓存容量一般都大于二级 高速缓存容量 开始使用COMA时,数据可以任意分配到 高速缓存C中,在运行过程中,数据将被 迁移到使用该数据的处理器结点的高速缓 存中
COW的每个结点驻留有一个完整的操作系统,而 MPP的每个结点中通常只驻留操作系统的微核
MIMD计算机访存模型
均匀存储访问模型(UMA Uniform Memory Biblioteka Baiduccess ) … P1 P2 Pn
非远程存储访问模型(NORMA NO-Remote Memory Access )
M P M M P M P
…
M P P P M
P
消息传递互连网络 (网络、环网、超立方、 立方环等)
P M P M
…
…
M
…
P M
所有存储器都是私有的,仅能由本地存储 器访问 每个结点都是由处理器P、本地存储器M和 (或)I/O设备组成的自治计算机,多个结 点由基于消息传递的互连网络相连 绝大多数NORMA都不支持远程存储器的访 问
高速缓存一致性非均匀存储访问模型 (CC-NUMA Cache-Coherent NonUniform Memory Access)
结点1
结点N
P/C
… P/C
M
P/C
… P/C
M
总线或交叉开关
总线或交叉开关 I/O NIC, DIR, RC
I/O
NIC, DIR, RC
系统互连网络
绝大多数商用CC-NUMA多处理机系统都使用基 于目录的高速缓存一致性协议来维护Cache的一 致性 保留了SMP结构的易于编程的优点,同时也改善 了常规SMP结构的可扩放性问题 该模型实际上是一个分布共享存储(DSM)多处 理机系统模型 该模型最显著的优点是程序员无需明确地在结点 上分配数据。由系统的硬件和软件自动对各结点 分配数据,在程序运行期间,由高速缓存一致性 硬件自动地将数据迁移到要使用它的地方
系统互连 (总线,交叉开关,多级网络)
…
I/O SM1 SMm
物理存储器被所有处理器均匀共享,所谓均匀共享 是指所有处理器访问任何存储器所需的时间均相同
每个处理器可带有私有高速缓存 外围设备以一定的形式被共享 由于高度共享资源而称为紧耦合系统
对称多处理机系统
所有处理机都能等同地访问所有I/O设备,能同 样地运行执行程序 只有一个或一组处理机能执行操作系统并能操纵 I/O,而其他处理器(称从处理器)只能在主处 理器的监控之下执行用户代码,不能直接运行 I/O程序
对称性,即每个处理器可以等同地访问共享存储器、 I/O设备和操作系统服务 由于对称,才能开拓较高的并行度
由于共享存储,限制了系统中的处理器不能太多, 用于互连的总线或交叉开关也难以扩展
大规模并行处理机系统MPP
MB MB
P/C
LM NIC
P/C
…
LM NIC
定制网络
Intel Paragon、IBM SP2、Intel TFLOPS和我国的曙光-1000等
…
定制网络 Stanford DASH、Cray T3D和SGI Origin 2000
高速缓存目录DIR用于支持分布式高速缓存的一
致性
DSM的共享存储器是由物理的分布在各处理结点
中的本地存储器LM组成 通过系统硬件和软件为用户提供一个单地址的编 程空间
工作站机群
MB P/C M B LD IOB NIC MB P/C M
…
LD
B IOB NIC
商品网络(以太网、ATM等)
Berkeley NOW、Alpha Farm、Digital TruCluster 都属于工作站机群
COW的每个结点都是一个完整的工作站
各结点通过一种低成本的商品网络互连,例如,以 太网、FDDI和ATM开关等 COW的每个结点内都有本地磁盘(LD),而MPP 的结点内没有LD
多指令流多数据流计算机
MIMD计算机结构模型
并行向量处理机PVP
VP VP
…
VP
交叉开关网络
SM
SM
…
SM
Cray C-90、Cray T-90、NEC SX4和我国的银河1号
对称多处理机系统SMP
P/C P/C
…
P/C
总线或交叉开关 SM SM
…
I/O
IBM R50、SGI Power Challenge、DEC Alpha服务器 8400和我国的曙光1号
处理结点采用商品微处理器 系统中有物理分布的存储器 采用高通信带宽和低延迟的互连网络 系统的处理结点可以扩放到成百上千个处理器 它是一种异步的MIMD机器,程序由多个进程组成, 每个进程都有其私有地址空间,进程之间采用消息 传递相互作用。
分布式共享存储系统DSM
MB P/C LM DIR NIC MB P/C LM DIR NIC
对称多处理机系统
对称多处理机的结构
P/C P/C … P/C
总线或交叉开关 SM SM … I/O
SMP结构的特点
对称性
系统中任何处理器都可以访问共享存储器的任何存储 单元和I/O设备,且具有相同的访存时间 共享存储器的所有存储单元都按单一地址空间编址
单一物理地址空间
只需要一个OS副本驻留在共享存储器中,OS可以按工 作负载情况在多个处理器上调度进程,从而易于达到 动态负载平衡和有效利用系统资源
非对称多处理机系统
非均匀存储访问模型(NUMA)
LM1
P1 P2 …
LM2
互 连 网 络
…
LMn
Pn
被共享的存储器在物理上分布在所有的处理器中, 所有本地存储器的集合组成全局地址空间 处理器访问存储器所需的时间不相等 每个处理器可带有私有高速缓存,外设也可以以 某种形式共享
GSM
GSM
…
GSM
全局互连网络(GIN)
P P … P 群1 CIN
CSM CSM
…
P
CSM
CIN
…
P … P
CSM
…
CSM
CSM
群N
全高速缓存存储访问模型 (COMA Cache-Only Memory Access)
互连网络
D
C P
D
C P
D
…
C P
各处理器结点中没有存储层次结构,全部 高速缓存组成全局地址空间 利用分布的高速缓存目录D对远程高速缓 存进行访问 COMA中的高速缓存容量一般都大于二级 高速缓存容量 开始使用COMA时,数据可以任意分配到 高速缓存C中,在运行过程中,数据将被 迁移到使用该数据的处理器结点的高速缓 存中