并行处理机和多处理机系统的概念、并行处理机与多处理机
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
并行处理机和多处理机系统的概念、并行处理机与多处理机系统的区别、多处理机运行过程。
多处理机性能模型
SIMD 计算机的概念
SIMD 计算机处理任务的性能计算。
并行处理机与多处理机系统的区别:
§并行处理机的并行性在于指令内部,而多处理机的并行性在于指令外部。
§并行处理机把同种操作集中在一起,由指令直接启动各个PE同时工作。多处理机用专门的指令来表示并发关系,一个任务开始执行时能够派生出与它同时执行的另一些任务,如果任务数多于处理机数,多余的任务进入排队器等待。
§并行处理机只有一个CU,自然同步。多处理机执行时间可能互不相同它们的工作进度不会也不必保持相同。
多处理机性能模型:
当多处理机系统以峰值速度运行时,所有处理机都在做着有用的工作,没有一台处理机处于空闲状态。N台处理机对系统性能都有贡献,系统的处理速度随N的增加而增加。但以下原因引起系统不能达到峰值性能:
……
( 请复习教材347 页)
典型例子:试在含一个PE 的SISD 机和在含8 个PE 的且连接成一个线性环的SIMD
机上计算
假定完成每个加法用30ns ,乘法50ns ,沿双向环在相邻PE 间移数需要10ns 。
( 1 )SISD 计算机上计算S 需要多少时间?
( 2 )SIMD 计算机上计算S 需要多少时间?
( 3 )SIMD 上计算S 相对于SISD 计算机的加速比是多少?
解:(1) 在SISD 机上,无需移数,所有运算是串行的,需要8 次加法,7 次乘法,因此:T0=8x30+7x50=590ns
(2) 在SIMD 机上,首先将8 个加法分配到8 个处理机上,然后在4 个处理机上执行4 次乘法,需移数1 次( 4 个处理机同时),然后再执行 2 次乘法,需移数2 次(同时),最后再执行一次乘法(移数 4 次),因此所需
T8=1x30+3x50+(1+2+4)x10=250ns
(3) 加速比S=T0/T8=590/250=2.36
在SIMD 上计算过程说明如下:
1 :在8 个PE 上执行加法,结果在8 个PE 中
2 :在PE2 、PE4 、PE6 、PE8 上执行乘,需要将PE1 、PE
3 、PE5 、PE7 的运算结果分别移到PE2 、PE
4 、PE6 、PE8
3 :在PE
4 、PE8 上执行乘法,需要将PE2 、PE6 的运算结果分别移到PE4 、PE8
4 :在PE8 上执行一次乘法,需要将PE4 的运算结果移到PE8 。
最后运算结果在PE8 上。