第六章 多机系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0 8

1 9
… …
7
15
① 水平方向用PM2+0,
PM2 –0,水平螺旋连接 ② 垂直方向用PM2+3, PM2-3,垂直螺旋连接
56
57

63
(以64为模)
源自文库
5、循环互联网络
1)实质:是对单级互联网络的重复使用,它可在一定 程度上模拟多级互联网络的性能
PUM0
PUM0
PUM0
α
a00
α α+1 α +2
a01 b01 c01
α
a77 b77 c77
α+1 b00 α +2 c00

α+1
α +2
设其单元地址为α 、α+1 、α+2,其中在α单元中有 存放A阵列数据aij, α+1单元放B阵式数据bij ,α+2单元放 C阵式数据cij
3)当CU取出距阵加指令时,可通过如下操作完成运算
①CU向各PU播发公共地址α 和读命令,各PU 分别取 出α 单元中的aij到PU的暂存器中。
② CU再向各PU播发公共地址α +1和读命令,使各 PU 分别取出α +1单元中的bij到PU的另一暂存器中。
③ CU再向各PU 下达求和命令(加法),使各PU完 成计算cij=aij+bij ④ CU再向各PU 播发第三个公共地址和写命令,使 各PU的计算结果存入α+2单元中。 3、对矩阵乘运算 C=A*B
② 第二次求和 PU0
①+②
PU1
③ +④
③ 第三次求和 PU0
⑤ +⑥
总结:阵列式多处理机最擅长完成有限差分方程
求解和矩阵加运算,也比较有利于矩阵乘运算, 还可加速累加和完成。 四、SIMD互联网络
1、概述 1)互联:多处理机之间相互联接进行通信成为互联。 2)互联函数:各处理机之间联结的某种拓扑结构的函 数称为互联函数。
7
0
1
8
12
13
9
当用Cube4时,可将两个立方体组进行连接 6 2 3 7 14 5 1 10 11 15
4
0
22
18 20 19
23
12
8 30 31 27
9
13
21
26
16
17
28
24
25
29
3、单级混洗交换互联网络
1)混洗互连函数 sh(Pn-1Pn-2…P1P0)= Pn-2…P1P0Pn-1 利用部件编码循环左移一位,可获得与下个部件相连 的编号
第六章
第一讲 概述 一、并行性概念
1、单机系统中的并行性
多机系统
1)当外设采用中断传送方式时,外设的机械动作与 CPU的运行可并行执行。 2)在多用户系统中,各用户的入出设备的机械动作也 在并行执行。 3)在重叠方式中,多条指令可以在不同的过程段上重 叠执行。
2、并行性的意义
1)并行性意味着有多个事件并发进行,可提高运行效 率。
.
bn0 bn1 … bnn
其中Cij=Σ aikbkj
k=0
n
4、可加速累加和运算
1)完成算式S= Σ ai
i=0 7
=a0+a1+a2+…+a7
① a0+a1
⑤ ①+②
② a 2+ a 3 ⑥ ③ +④
③ a4+a5 ⑦ ⑤ +⑥
④ a6+a7
2)当采用一个处理机完成时,需要七步求和完成 3)当采用多个处理机计算时,可减少求和时间的次数 ①第一次求和用4个处理机完成 PU0 a0+a1 PU1 a2+ a3 PU2 a4+a5 PU3 a6+a7 (同时计算)
如:f(i)=i+1 (i=0~7,且以8为模) 按此函数实现的连接关系表:0 1,1 2,2 3 …5 6, 6 7, 7 0 3)互联网络:实现处理机之间联结的某种拓扑结构的 逻辑电路称为互联网络 出 入
0
1
2 3 4 5 6 7
4)对互联网络的基本要求
① 有利于实现
② 可实现多种灵活的连接
③要有一定通信频率 5)互联网络的分类 ① 从级数来分 Ⅰ)单级互联网络(仅一级) Ⅱ)循环互联网络(物理一级,但可实现多级功能) Ⅲ)多级互联网络(有多级)
②按特征性能来分 Ⅰ)立方体互联网络 Ⅱ)混洗交换互联网络 Ⅲ)PM2I互联网络 在立方体和混洗交换互联网络中,处理机(或部件) 用编码P表示,其中编码所用二进制位数与部件数相关, 如当有8个部件时,需要用三位二进制表示,则用P2P1P0 表示部件编码。
以指令为单位构 成指令流水线
多处理机结构
宏流水线 异构型多机系统
同构型、并列 式、阵列式
分布式多机系统
三、多机系统中的耦合度
1、何谓耦合度 多机间相互通信能力或相互依赖程度称为系统的耦 合度。 2、几种耦合度
1)最低耦合度。通信能力低,依赖程度小。如两台 计算机间仅用两三条线连接通信,无任何性能。
a00 a01 … a0n
b00 b01 … b0n
a10 a11 … a1n
A=
。 。 。
b10 b11 … b1n
.
B=
。 。 。
an0 an1 … ann
c00 c01 … c0n C=
c10 c11 … c1n cn0 cn1 … cnn
. 。 。 。
如C00= a00b00 + a01b10 + a02b20 + … + a0nbn0 阵列式多处理机也比较有利于矩阵乘运算,但不如 矩阵加
0 0 1 2 3 1 2 3 4 4 5 6 7 5 6 7


④ Cube2可实现8个部件在 Z 方向的连接(见立方图)
4)当有16个部件时,可组成两个立方体,而在两个立 方体之间可用Cube3实现两个立方体的连接
① 互联函数:Cube3 (P3P2P1P0)= P3P2P1P0 ② 连接关系表: 0 8,1 9,2 10,3 11 4 12,5 13,6 14,7 15 8 0,9 1,10 2,11 3 6 12 4,13 5,14 6,15 2 4 3 7 14 5 10 11 15
0 1 2 3 4 5 6 7
当i=1时,PM2(j)+ 1 = j + 21 = j + 2,可实现
0 1 2 3 4 5 6 7
② PM2 -I = PM2(j) – 2i
当i=0时,有
0 1 2 3 4 5 6 7
当i=1时,有
0 1 2 3 4 5 6 7
2)阵列式处理机所用的PM2I互连函数
PUI+8 PUI-8
… … … …
其它PU可通过联网络进行通信
三、阵列式多处理机的算法
1、完成有限距离的拉普拉斯方程的求解(它是一个具 有二阶偏导数的偏微分方程)
其最后的计算公式如下
U(x,y) = (U(x+h,y) + U(x,y+h)+ U(x-h,y) + U(x,y-h))/4 其中U(x,y) 为某一点的参数,h为有限距离 上式意义在 于每次计算某点 U(x,y) U(x+h,y) 参数值可直接用 其四周参数的平 U(x,y-h) 均值
0 2 3 4 5 6 7 4 5 6 7 0 1 2 3
1
④ Cube1可实现8个部件在 Y 方向的连接(见立方图)
3)Cube2
① 互联函数:Cube1 (P2P1P0)= P2P1P0 ② 实现的连接关系表: 0 4,1 5,2 3 7, 4 0, 5 1,6 2,7 3
6,
③实现的连接关系图
2)当n=3时,(共8个部件)可实现如下连接关系
P2P1P0
0 0 0 0 1 0 0 1 2 0 1 0 3 0 1 1 4 1 0 0 5 1 0 1
P1P0P2
0 0 0 0 1 0 1 0 0 1 1 0 0 0 1 0 1 1 0 2 4 6 1 3 它将8个部件分为四组, 每组之间互不相关
4、单级PM2I互联网络
1)PM2I互联函数 PM2I有两大类 一大类是 PM2 + I = j + 2i(i=0~j-1) 另一大类是 PM2 – I = j – 2i (i=0~j-1) ① 当i=0时,PM2(j)+ 0 = j + 20 = j + 1 若有8个部件,也以8为模时, PM2(j)+ 0 可实现
. 。 。 。
B=
b70 b71 … b77
.
。 。 。
c00 c01 … c07 c10 c11 … c17 C=
. 。 。 。
c70 c71 … c77
cij=aij+bij
2)阵列数据分配 (每个PU除共享公共主存外,还有自己的局部存储 器PUM,随PU排列,因此PUM又称阵列存贮器)每 个PUM为1K 每个PUM占用三个单元
4 5 6 7 0 1 2 3
6 1 1 0
7 1 1 1
1 0 1 5
1 1 1 7
3)在混洗基础上加上Cube(0)的交换时称为混洗交换 Cube(0)为P2P1P0 0 1 ,1 P2P1P0 3,3
0
0 ,2
2 ,4 出 入
1
2 3
5 ,5
4,
6 7 ,7
6
4)混洗交换互联网络
4
5 6 7
2、多计算机系统特点 1)具有多个处理机 2)具有多个指令译码分析部件 3)各处理机有自己的主存与I/O通道 4)各处理机要在统一的操作系统控制下协调工作 (如网络操作系统) 5)MIMD结构 6)松散耦合
第二讲 多处理机系统 一、多处理机系统分类
1、并行式多处理机系统 各处理机构成地位完全相同,位置可互换,主要用于 对向量数据(一维)的计算。
1、伊Ⅳ总体结构 具有两个象限的阵列处理部件
CU
CU
• A为阵列处理部件 • 每个阵列处理部件由 64个PU(阵列处理机) 构成 • CU是对阵列处理部件 A进行控制的阵列控制 部件,由它可向A的各 PU发出相应的控制命令, CU是A的指令译码分析 部件,MM为主存 (A,CU共享)
A
MM
A
A CU D
2、阵列式多处理机系统
各处理机的构成完全相同,但处理机排列成矩阵结构, 如4*4,8*8等,主要对阵列数据(二维)进行处理。 3、分布式多处理机系统 各处理机的构成可以不同,处理地位也可以不同,主 要用于对同时产生不同性质的多发事件处理。
其中,1,2属同构系统,3属于分布式处理系统
二、阵列式多处理机系统简介(伊Ⅳ)为主
2)若有多个相同的事件同时进行着,意味着对某事件 有多个装置进行数据处理,可靠性高。
3)并行也可意味着须多套装置来完成。
二、从单机系统向多机系统发展的三条途径
单机系统
一条指令多个 过程段
资源共享 多用户系统分时共 享CPU 将单机在不同时间虚 拟成不同概念结构 用微小型机来代替 虚拟结构 多存贮器结构
A CU
I/O通道
2、阵列结构A
1)由64个8行8列排成阵列的PU来构成 PU0 PU8 PU56 PU1 … … … PU63 PU7
2)横的排列按±1的模式,且以64为模进行排列与连 接
3)纵的排列按±8的模式,且也以64为模进行行列连接 4)每一个PU可直接和四周的PU进行通信
例:PUI
PUI+1 PUI-1
设部件数为n,则所用编码二进制位数为┌log2n┐,如 需要用4位编码时,可用P3P2P1P0表示。
2、单级立方体互联网络(用Cube表示) 1)Cube0(以n=8,用 P2P1P0表示) ① 互联函数:Cube0 (P2P1P0)= P2P1P0 ② 实现的连接关系表: 0 1 ,1 0 ,2 3 3 2 ,4 5 ,5 4 ,6 7 ,7 6 ③实现的连接关系图 P2P1P0 P2P1P0 入 0出 000 001 010 011 100 101 110 111 001 000 011 010 101 100 111 110
U(x,y+h)
U(x-h,y)
按此进行计算,可称为“平滑”或“数字滤波”
而阵列式处理机的每个PU可同时从四周的PU获取参 数,因而阵列多处理机很适合于有限差分方程求解。
2、完成距阵加运算
1)完成算式C=A+B a00 a01 … a07
b00 b01 … b07
b10 b11 … b17
A=
a10 a11 … a17 a70 a71 … a77
1 2 3 4 5
6
7
③ 0
1
2
3
4
5
6
7
④ 当把0~7共8个部件排成一个立方体时,Cube0可实 现8个部件在 X 方向的连接 6 2 4 0 1 3 5 7
Y
Z
X
2)Cube1(以n=8,用 P2P1P0表示) ① 互联函数:Cube1 (P2P1P0)= P2P1P0 ② 实现的连接关系表: 0 2 , 1 3,2 0, 3 1, 4 6, 5 7, 6 4,7 5 ③实现的连接关系图 出 入
2)松散耦合度。通信能力较强,依赖程度较高。如连 接在网上的计算机,在高速中主机与处理机之间也属 此类。 3)紧密耦合。依赖程度最强,如阵列式,并行式处理 机与控制部件(CU)之间。
四、多机系统的特点和分类
1、多处理机系统 1)具有多个处理机 2)具有一个指令译码执行部件 3)各处理机共享公共主存与I/O通道 4)各处理机要在统一的操作系统控制下工作 5)它们属于SIMD结构 6)它们属于紧密耦合
相关文档
最新文档