流水技术与向量处理

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如每段时间都为t,则i 执 1行n条指令所用的时间为:T=3nt
主要优点:控制简单,节省设备。 主要缺点:执行指令的速度慢,功能部件的利用率很低。
取指令k 分析k 执行k 取指令k+1 分析k+1 执行k+1
2020/7/10
9
2、重叠执行方式(最简单的流水线方式)
取指 分析 执行 取指 分析 执行 取指 分析 执行
把取第k+1条指令提前到分析第k条指令同时执行 如果三个过程的时间相等,执行n条指令的时间
为:T=(2+n)t
理想情况下同时有三条指令在执行 处理机的结构要作比较大的改变,必须采用先行
控制方式
2020/7/10
11
重叠方式对计算机组成的要求
1.访存冲突 分析与取指均要访问主存 解决: 1)采用两个独立编制的存贮器 数据/指令 但增加了复杂性 2)采用多体交叉存贮器 3)指令缓冲寄存器
增设数据缓冲栈,保证不同指令的读、写操作
并行;增设先行操作栈,保证执行部件能连续
执行。 2020/7/10
17
❖ 工作原理
主存


先行 指令栈
先行读 数栈
后行写 数栈
数据缓冲栈
指令分析器 先行操作栈
执行 部件
栈的深度要求:D指缓≥D操作≥ D读栈≥ D写栈
3批衣服的整个工作时间为3*3*5=45分钟
2020/7/10
Leabharlann Baidu
4
第二种:重叠工作方式,设计三个部件,可以同时 工作,每个部件只做一样工作,操作方式如下图:
T
第1批洗涤 第1批清洗 第1批甩干
第2批洗涤 第2批清洗 第2批甩干
第3批洗涤 第3批清洗 第3批甩干
Δt
Δt
Δt
Δt
Δt
3批衣服的工作时间为5*5=25分钟,节省20分钟。
性分析 ❖ 了解标量流水、超标量流水、超流水及超长
指令字计算机的基本工作原理
2020/7/10
2
提高指令执行速度的主要途径: (1) 提高处理机的工作主频 (2) 采用更好的算法和设计更好的功能 部件 (3) 采用指令级并行技术
三种指令级并行处理机: (1) 流水线处理机和超流水线(Superpipelining)处理机 (2) 超标量(Superscalar)处理机 (3) 超长指令字(VLIW: Very Long Instruction Word)处理机
❖ 缓冲技术:在工作速度不固定的两个功能部件 之间设置缓冲栈,用以平滑它们的工作
❖ 预处理技术:把进入运算器的指令都预处理成 R-R型指令,与缓冲技术相结合,为进入运算 器的指令准备好所需的全部操作数
❖ 先行控制方式使运算器可专注于运算,从而可 大幅度提高程序的执行速度
❖ 硬件要求:增设指令缓冲栈,消除取指过程;
如果每个过程的时间相等,则执行n条指令的 时间为:T=(1+2n)t
主要优点: 指令的执行时间缩短 功能部件的利用率明显提高
主要缺点:
需要增加一个IBR
2020/7/10
10
3、更高重叠度的重叠解释方式 取指k 分析k 执行k 取指k+1 分析k+1 执行k+1 取指k+2 分析k+2 执行k+2
2020/7/10
6
指令的重叠解释与先行控制
❖ 计算机系统中广泛存在着重叠工作方式 ❖ 指令的解释方式一般只有三种:顺序、重叠
和流水 ❖ 重叠和流水给指令的执行带来了高的吞吐率
和加速比,同时也给系统增加了障碍
2020/7/10
7
指令的解释过程
ALU
LOAD/STORE
IF
取指
ID 译码、读寄存器堆
取指 译码、读寄存器堆
EX
执行
计算访存有效地址
MEM
---
访存(读或写)
WB 结果写回寄存器堆 将读出的数据写入寄存器堆
2020/7/10
8
一、指令的重叠解释方式
1、顺序执行方式 一条指令的执行过程:取指令->分析->执行
执行n条指令所用的时间为:
n
t t t T ( 取指令 i 分析 i 执行 i)
2020/7/10
5
引出下述关于洗衣机工作的有关性能特点: 吞吐率:单位时间内完成的任务数TP=n/T 加速比:串行方式与流水线方式的时间比:上述为 45/25=1.8 效率:即洗衣机的利用率,上述洗衣机的效率是 9/15=3/5=60%
将一条指令的执行分为几个阶段,让几条指令按重 叠或流水方式工作,以提高程序的执行速度。这就 引出了计算机中的流水线技术。
2020/7/10
3
4.1 标量流水工作原理
❖ 什么是流水线?
考虑设计一个洗衣机的工作流程,假定它有三道 工序:洗涤、清洗、甩干。每个环节为5分钟。
需要完成的任务为3批,则考虑下述工作方式的工 作效率:
第一种:串行工作方式,即按照如下方式工…作… :
第1批 第1批 第1批 第2批 第2批 第2批 第3批 第3批 第3批 洗涤 清洗 甩干 洗涤 清洗 甩干 洗涤 清洗 甩干
第4章 流水技术与向量处理
4.1 标量流水工作原理 4.2 标量流水中的障碍及控制 4.3 流水线的调度技术 4.4 先进的流水技术 4.5 Pentium微处理器中的流水技
术 4.6 向量流水技术
2020/7/10
1
本章学习要求
❖ 掌握标量流水的性能分析及障碍的处理方法 ❖ 掌握非线性流水调度技术 ❖ 掌握向量流水机的结构特征、向量指令并行
2.功能部件的冲突 解决:设置独立的分析部件和执行部件
2020/7/10
12
3.同步 分析与执行所需的时间不同,要求的是一
次 重叠
一 次 重 叠 : 任 何 时 间 都 是 “ 分 析 K+1” 与 “执行K”的重叠 =>相邻两条指令的重叠
分析K 执行K
分析K+1 执行K+1
T=(n+1)t
2020/7/10
分析k
执行k
执行部件空闲 分析k 执行k
分析k+1
执行k+1
分析k+1
执行k+1
分析部件空闲
分析k+2
(a)重叠方式
执行k+2
分析k+2
执行k+2
(b)先行控制
n
T重 t分1
max(t分i , t执i1 ) t执n
i2
n
T先 t分1
t执i
2020/7/10
i 1
16
❖ 关键:缓冲技术+预处理技术
13
4.转移
无条件转移/条件转移当转移成功时,重叠预 取无效,变为顺序执行
应尽可能不使用或少使用条件转移指令
5.相关
邻近指令之间出现某种关联,为避免出错而不 能同时执行的现象。
局部性相关、全局性相关
2020/7/10
14
2020/7/10
15
先行控制技术
v 基本思想:使分析和执行部件分别连续不断地运行,使部 件空闲状态减至最低。
相关文档
最新文档