3-2 流水线技术
第二章 流水线
从理论上说, 级过程段的流水线处理n 从理论上说,一个具有 k级过程段的流水线处理n个任 务所需的时钟周期数为: 务所需的时钟周期数为: Tk=k+(n – 1) 非流水线的硬件来处理n个任务所需的时钟周期数为: 非流水线的硬件来处理n个任务所需的时钟周期数为: TL=n×k × K级线性流水线的加速比 K 级线性流水线的加速比C 级线性流水线的加速比 Ck=TL / Tk=(n×k) / [k+(n – 1)] × 当n>>k时,Ck→k n>>k时
L 输入 S1
L S2
L S3
L S4
L 输出
时钟C 时钟 四级流水浮点加/ 四级流水浮点加/减运算的基本结构
流水线需在各个过程段之间设置高速缓冲寄存器L 流水线需在各个过程段之间设置高速缓冲寄存器 线性流水线时钟周期 τ=max{τi}+τl =τm+τl τ τ τ τ
式中max{τi}表示取所有过程段中所需的最长操作时间。 τ 表示取所有过程段中所需的最长操作时间 表示取所有过程段中所需的最长操作时间。 式中
4) 按照流动是否可以乱序来分
◆ 顺序流动流水线:流水线输出端任务流出的顺 顺序流动流水线:
序与输入端任务流入的顺序相同。 序与输入端任务流入的顺序相同
◆ 异步流动流水线(乱序流水线):流水线输出 异步流动流水线(乱序流水线): ):流水线输出
端任务流出的顺序与输入端任务流入的顺序 不同。 不同
解:(1) 加法器的流水线时钟周期至少为:τ=90ns + 10ns 加法器的流水线时钟周期至少为: =
如果采用通用的逻辑电路,但不是流水线方式, 如果采用通用的逻辑电路,但不是流水线方式,则浮点加法所需 的时间为τ 的时间为 1 +τ2 + τ3 +τ4 = 300ns 因此,4级流水线加法器的加速比为 因此, 级流水线加法器的加速比为 Ck = 300/100 = 3 当每个过程段的时间都是75ns时, (2) 当每个过程段的时间都是 时 则加速比为: 则加速比为:Ck = 300/75 = 4
计算机系统结构第3章流水线技术
流水线调度
根据指令的依赖关系和资源可用性,动态调 度指令到不同的流水线阶段。
GPU设计中的流水线技术
线程级并行
通过划分线程块和线程束,实现线程级并行执行。
数据级并行
将数据划分为多个块,每个块在GPU的多个处理单元上并行处理。
指令级并行
通过指令调度和分支预测,实现指令级并行执行。
硬件资源共享
01
硬件资源共享是指流水线中的多个操作共享相同的硬件资源, 如寄存器、缓冲区等。
02
硬件资源共享能够提高资源利用率,减少硬件开销,降低成本。
需要注意的是,硬件资源。
流水线的性能指标
01
吞吐量
流水线每单位时间内完成的操作数 或任务数。
流水线调度
根据子任务的依赖关系和资源需求,动态调 度子任务到不同的计算节点。
THANKS
感谢观看
将执行结果写回寄 存器或内存。
02
流水线的工作原理
数据流驱动
1
数据流驱动是指流水线中的操作按照数据流动的 方向依次执行,每个操作在完成前需要等待前一 个操作的结果。
2
数据流驱动的优点是能够充分利用数据依赖关系, 减少等待时间,提高流水线的吞吐量。
3
需要注意的是,数据流驱动需要精确控制数据流 动的顺序,以避免出现数据相关和冒险问题。
调试和维护困难
由于流水线中各个阶段是并行处 理的,调试和维护可能会比串行 系统更加困难。
05
流水线技术的应用
CPU设计中的流水线技术
指令划分
将指令划分为多个阶段,每个阶段对应一个 功能单元,从而并行执行多个指令。
数据路径设计
计算机系统结构 第 3 章 流水线技术_标量
2014-3-10
27
非线性流水线
反馈回路
• 流水线的流动顺序: • S1→S2 →S3 →S2 →S3 →S4 →S1 →S2
2014-3-10
28
1 s1 s2 s3 s4 1
2 1
3
4 1
5
6
7 1
8 1
9
1
1 1
• 为了防止两条或两条以上的指令对同一功能段的 争用,非线性流水线需要对输入流水线的指令进 行比较复杂的控制。 • 非线性流水线通常使用预约表来进行分析。
i 2
n
2014-3-10
7
执行时间不等时的一次重叠工作方式
分析 k
执行 k 分析 k+1 执行 k+1 分析 k+2 执行 k+2 分析 k+3 执行 k+3
2014-3-10
8
3. 先行控制方式
• 先行控制方式的基本思想: • 通过设置先行读数栈,先行操作栈,后行写数 栈等,使分析部件和执行部件能够分别连续 不断地分析和执行指令。
1 t s t l
• 若每个流水段的延迟时间不等,则最高工作频率 为:
1
max t Si t l
n i 1
2014-3-10
16
流水技术的特点
• ⑴ 一条流水线通常由若干个有联系的流水段组成。 • 流水线中的段数也称为 “流水深度” 。 • ⑵ 每个流水段有专门的功能部件对指令进行某种 加工。 • ⑶ 各流水段所需时间应尽量相等,以减少流水线 的瓶颈影响。 • ⑷ 流水线工作阶段可分为建立(装入)、满载和排 空三个阶段。 • ⑸在理想情况下,当流水线充满后,每隔Δ t时间 将会有一个结果流出流水线。
流水线的技术要求
流水线的技术要求
一、流水线运转上:
1、不得有卡车现象;
2、吊具应与水平面成45度角在涂料槽中均匀滚动,进/出涂料槽时,吊具运转平稳,不得有使模组左右摆动,禁止有磕碰现象;
3、吊具应与水平面成90度角度在硬化槽中滚动,进/出硬化槽时,吊具运转平稳,不得有使模组左右摆动,禁止有磕碰现象;
4、吊具应与水平面下仰15度角在雨淋式撒砂机槽中滚动,撒砂均匀。
二、流水线环保要求:
1、粉尘/噪音应达到国家相关安全技术标准,粉尘量不大于100毫克/立方米,噪音小于85分贝。
2、室内减少氨气,现场设有排风扇,做到空气畅通;
3、周围环境、机动运行部位、用电部位应有安全防护栏,危险部位设有标识。
软件设计师计算机体系结构考点:流水线技术
软件设计师计算机体系结构考点:流水线技术【考法分析】本考点涉及的考查形式有:(1)流水线相关理论概念;(2)流水线相关计算。
【要点分析】1.流水线理论概念(1)流水线是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。
各种部件同时处理是针对不同指令而言的,它们可同时为多条指令的不同部分进行工作,以提高各部件的利用率和指令的平均执行速度。
(2)流水线建立时间:1条指令执行时间。
(3)流水线周期:执行时间最长的一段。
2、流水线相关计算:(1)流水线执行时间(理论公式):(t1+t2+..+tk)+(n-1)*∆t。
(2)流水线执行时间(实践公式):k*∆t +(n-1)*∆t。
(3)流水线吞吐率:TP = 指令条数/ 流水线执行时间。
(4)流水线最大吞吐率1 / ∆t。
(5)流水线加速比:顺序执行时间/流水线执行时间。
【备考点拨】吞吐率:单位时间内流水线处理机流出的结果。
对指令而言就是单位时间内执行的指令数。
如果流水线子过程所用的时间不一样,则吞吐率P应为(最长子过程的倒数)。
流水线开始工作,需要经过一段时间才能达到最大吞吐率。
【相关考题】1.下列关于流水线方式执行指令的叙述中,不正确的是()。
A.流水线方式可提高单条指令的执行速度B.流水线方式下可同时执行多条指令C.流水线方式提高了各部件的利用率D.流水线方式提高了系统的吞吐率2.流水线的吞吐率是指单位时间流水线处理的任务数,如果各段流水的操作时间不同,则流水线的吞吐率是()的倒数。
A. 最短流水段操作时间B. 各段流水的操作时间总和C. 最长流水段操作时间D. 流水段乘以最长流水段操作时间。
第三章第二节 流水作业
第二节流水作业一、流水作业法的经济效果通过对顺序作业法、平行作业法、流水作业法的比较,流水作业法是一种比较科学的施工组织方法,它建立在合理分工、紧密协作和大批量生产的基础上。
在公路工程施工过程中,将建筑产品施工的各道工序分配给不同的专业队依次去完成,每个专业队沿着一定的方向移动,在不同的时间相继对各个施工任务(施工段)进行相同的施工,由此形成专业队、施工机械和材料供应的移动路线,称为流水线。
公路工程施工现场规模较大,可容纳各种不同专业的工人、施工机具,在不同的位置进行施工生产,即将施工对象划分为若干个施工段,以流水形式组织施工作业,使整个施工过程始终连续、均衡、有节奏的施工。
公路工程施工任务不论是分部、分项工程,还是基本建设项目,都可以组织流水作业,即小到一道工序大到一个基本建设项目,都可以按流水作业法组织施工。
流水作业的经济效果,可归纳为以下几点:(1)可以缩短工期,尽早交付使用,发挥投资效益;(2)有利于提高劳动生产率;(3)有利于提高工程质量;(4)有利降低成本,提高利润;(5)可以保证机械和劳动力得到充分、合理的利用;(6)可以减少现场管理费和物资消耗,提高综合经济效益。
二、流水作业的分类流水作业可分为:分项工程流水作业、分部工程流水作业、单位工程流水作业和群体工程流水作业等几种形式。
前两种流水作业组织的基本形式。
三、流水作业的基本方法组织流水作业的基本方法如下:1.划分施工段划分施工段就是把劳动对象(工程项目)按自然形成或人为地划分成劳动量大致相等的若干段。
如:一个标段上有若干道小涵洞,可以把每一个小涵洞看作是一个施工段,这就自然形成了若干施工段。
如果把一个标段的路线工程部分,划分成1Km一段,就属于人为地把劳动对象划分成了若干施工段。
2.划分工序划分工序就是把劳动对象(工程项目)的施工过程,划分成若干道工序或操作过程,每道工序或操作过程分别按工艺原则建立专业班组,即有几道工序,原则上就应该有几个专业施工队。
高性能计算中的流水线技术分析(三)
在高性能计算中,流水线技术是一种重要的优化手段,可以提高计算效率和性能。
本文将从流水线技术的基本原理、流水线相关的问题以及流水线技术的应用等几个方面进行分析。
1. 流水线技术的基本原理流水线技术是将一项复杂的任务分解为多个子任务,并将它们分别在不同的处理阶段进行处理,从而实现并行计算。
流水线中的每个阶段都有专门的功能和任务,每个阶段的输出作为下一个阶段的输入,形成了一条流水线的运行模式。
流水线技术的基本原理是时间重叠和空间共享。
通过将一个任务划分为多个阶段,在每个阶段的同时进行处理,可以充分利用硬件资源,加快计算速度。
同时,由于每个阶段的处理结果会在下一个阶段使用,可以保持计算流程的连续性,提高整体性能。
2. 流水线相关的问题尽管流水线技术可以提高计算效率,但也存在一些问题需要解决。
首先是数据依赖性问题,即某个阶段的计算结果依赖于前面阶段的计算结果。
一旦前面的计算结果尚未完成,后续的计算就无法进行,从而导致流水线停顿,降低了整体性能。
此外,流水线中的每个阶段都需要有足够的处理时间,否则就会出现阶段饱和的情况。
而某些任务可能会引起阶段的处理时间不均匀,从而导致流水线的性能下降。
3. 流水线技术的应用流水线技术在高性能计算中有着广泛的应用,尤其是在图像处理、模拟计算、数据压缩等领域。
以图像处理为例,流水线可以将图像的不同处理任务划分为多个阶段,从而实现并行计算,提高图像处理的速度和效率。
此外,在模拟计算中,流水线技术可以将复杂的数值计算过程分解为多个阶段,并分别在不同的处理器上进行计算,从而实现并行计算,提高计算效率。
在数据压缩方面,流水线技术可以将压缩的不同处理步骤划分为多个阶段,每个阶段负责一个处理步骤,从而加快数据压缩的速度。
总之,流水线技术作为一种重要的优化手段,在高性能计算中发挥着重要作用。
通过合理地使用流水线技术,可以提高计算效率和性能,进而满足不同领域对计算速度和效率的需求。
对流水线技术的进一步研究和改进,有助于更好地发挥高性能计算的潜力,推动科学技术的发展。
第3章流水线技术
第2章流水线技术流水线是计算机体系结构设计中普遍应用的技术。
本章介绍流水线的基本概念、表示方法、和分类,讨论流水线实现的基本结构、线性流水线的性能与非线性流水线的调度策略,分析流水线的相关及其处理方法。
2.1 流水线的基本概念2.1.1 多条指令的执行方式一条指令的执行过程可以分为多个阶段,通常分为三个阶段,执行过程如图2-1所示。
第一阶段是取指令,按照程序计数器的内容访问主存储器,取出是一条指令送到指令寄存器。
第二阶段是分析指令,对指令寄存器中的指令进行译码分析,即对指令操作码进行译码,分析指令的功能,依据给定的寻址方式和地址码字段的内容形成操作数地址,并读取操作数(立即数寻址除外);同时,程序计数器自动产生一个增量,指到下一条指令。
第三阶段是执行指令,根据操作码的要求,对操作数进行运算和处理,完成指令规定的功能,并把运算结果送到指定的地址中。
指令执行过程中的第一阶段,一定要访问主存(指令一定在主存中),而在后两个阶段,也可能要访问主存(当操作数在主存中时)。
当有多条指令要在一个处理机中完成时,可以有多种执行方式。
现假设3个阶段所需要的时间均为△t 。
2.1.1.1 顺序执行方式顺序执行方式是指在任何时刻,处理机中只有一条指令在执行,指令之间是顺序串行执行的,即第k条指令执行完成后,再执行完成第k+1条指令,依次类推。
多条指令执行过程如图2-2(a)所示,执行n条指令所需要的时间为T = 3n△t。
顺序执行方式的优点是控制简单,节省设备。
主要缺点有两个,一是处理机执行指令的速度慢。
只有当上一条指令执行完毕后,下一条指令才能开始执行。
二是功能部件的利用率低。
如取指令时主存是忙碌的,而指令执行部件是空闲的。
2.1.1.2 一次重叠执行方式一次重叠执行方式是指在任何时刻,处理机中至多只有两条指令在同时执行,即使第k 条指令的执行阶段与第k+1条指令的取指令同时进行。
多条指令执行过程如图2-2(b)所示,执行n条指令所需要的时间为T = (2n+1)△t。
流水线技术
流水线技术流水线技术是一种高效的生产工艺,能够大大提高生产效率和降低成本。
它被广泛应用于各种制造行业,如汽车制造、电子产品制造、食品加工等。
本文将对流水线技术的原理、优势和应用进行详细介绍。
一、流水线技术原理流水线技术的核心原理是将整个生产过程划分为若干个连续的独立工作站,每个工作站负责完成一项具体的任务或工序。
产品在流水线上按照固定的顺序经过各个工作站,每个工作站只需完成相应的工序,然后将产品传递给下一个工作站。
流水线技术的顺序流程可以按照产品的不同特性和工艺要求来设计。
有些产品需要按照指定的工序顺序进行处理,而有些产品则需要在流水线上经过多个不同的工作站进行加工,以达到最终的成品要求。
二、流水线技术的优势1. 提高生产效率:通过将生产过程进行细分并利用并行处理,流水线技术可以大大提高生产效率。
工作站之间的协调和衔接使得产品在不间断流动的情况下进行加工,从而减少了非价值增加的等待时间。
2. 降低生产成本:在流水线上,人力资源的利用更加高效,无需每个工人都掌握所有工序的技能,只需要专注于自己所负责的工序。
这不仅可以提高工人的专注度,还可以降低培训成本。
3. 简化管理:流水线技术可以将复杂的制造过程分解成若干个简单的工序,每个工序由专人负责,使得生产管理更加简化。
管理者只需监控整个流水线的运行情况和协调各个工序的衔接,而不需要详细了解每个具体工序的细节。
4. 质量可控性强:流水线上的每个工序都可以进行专门的检测和控制,确保产品在各个工序中的质量。
一旦出现质量问题,可以及时追溯到具体的工序和责任人,以便进行纠正和改进。
三、流水线技术的应用1. 汽车制造:汽车生产过程中各个工序的高度标准化和流程化使得流水线技术成为汽车制造的理想选择。
从焊接、涂装到总装,每个工作站都有专业的操作人员,确保汽车制造过程的高效和质量。
2. 电子产品制造:电子产品制造过程中需要经过多个工序,如组装、焊接、测试等。
流水线技术可以有效地管理这些工序,提高生产效率和保证产品质量。
第三章流水线技术.ppt
ExtOp
MemtoReg
ALUSelB
chapter3.3
3.1 流水线的基本概念
• 洗衣为例 • Ann, Brian, Cathy, Dave 每人进行洗衣的动作: wash, dry, and fold • washer需要 30 minutes • Dryer 需要 40 minutes • “Folder” 需要 20 minutes A B C D
– 45 ns/cycle x 1 CPI x 100 inst = 4500 ns
• 多周期机器
– 10 ns/cycle x 4.6 CPI (due to inst mix) x 100 inst = 4600 ns
• 理想流水线机器
– 10 ns/cycle x (1 CPI x 100 inst + 4 cycle drain) = 1040 ns
32
WrAdr 32 Din Dout
Ideal Memory
Rt 0 Rd
Reg File
busA A
32
2019/3/18
Mux
32
4 B
32
Mem Data Reg
0
1 Mux 0
Mux
1
32
1
2 3
32 32
<< 2
ALU Control
Imm 16
Extend
32
ALUOp
中国科学技术大学
• Step 2 step
ID - instruction decode and register fetch
– A <-- Regs[IR6..10] – B <-- Regs[IR11..16]
流水线使用说明书
高压隔离开关 GW4-40.5、72.5 、126整体装配流水线设备使用说明书目录设备简介 (3)概述 (3)设备简介 (3)安装及使用 (6)2-1 设备安装 (6)一、连接设备 (6)二、准备工序 (8)2-2 各工位装配工艺 (18)一、上线工位 (18)二、底架安装工位 (19)三、绝缘子检测工位 (22)四、导电安装 (24)五、隔离开关分合闸角度检测磨合试验及回路电阻测试工位 (26)2-3 生产进度显示及装配数据记录 (27)一、生产进度显示 (27)二、装配数据记录 (28)故障诊断 (31)设备使用时注意事项 (32)售后服务 (34)设备简介概述设备简介本使用说明书适应于高压隔离开关GW4-40.5、GW4-72.5、GW4-126此三种高压隔离开关整体装配、检测装配线设备操作、保养维护指导,总体上达到装配、检测一体化、检测数据信息化管理。
生产线总体工作流程图如下:产品下线产品检测导电安装瓷瓶安装底架安装装配小车2000mm2750mm2000mm2750mm2750mm2000mm工位6工位5工位4工位3工位2工位1总装线导电分装工位图 1 装配线工作流程图一、总装线功能简介:①GW4-40.5、GW4-72.5、GW4-126高压隔离开关整体装配、检测流水线以轨道为支撑,装配小车作为装配载体,人工推动小车进行工序间流转;②总装线由装配、检测线和装配小车回程线两部分组成,装配、检测线上设置以下六个工位:上线工位、底架装配工位、瓷瓶检测工位、导电安装工位、隔离开关分合闸角度检测磨合试验及回路电阻测试工位,六处分步装配在同一个装配周期内完成;③1 处:工装推动到回程线,装配小车从回程线滑动至装配始端,减速电机拖动工装至总装线;④ 2 处:在装配小车上完成底架装配,使用专用工装保证轴承座杠杆端面水平,中心距一致;⑤ 3 处:在装配小车上完成瓷瓶安装,垂直度测量;⑥ 4 处:在装配小车上完成导电安装;⑦ 5 处:在装配小车上完成出厂分合闸角度和回路电阻检测及产品磨合试验;⑧ 6 处:产品下线,吊装产品下线,装配小车从回程线返回至装配线始端;⑨传输周期: 6 处分步装配全部完成,分步完成按钮全部按下,所有装配小车方可推动至下一工位,在传输过程中完成数据采集(详见数据采集),开始下一节拍装配。
计算机体系结构第三章答案
第三章答案三、流水线技术(80空)1、对阶尾数相加2、求阶差规格化3、时间流水线的各段4、尽量相等流水线的瓶颈5、通过时间大量重复的时序输入端能连续地提供任务6、静态动态7、部件级处理机级8、标量流水处理机向量流水处理机9、线性流水线非线性流水线10、执行/有效地址计算周期存储器访问/分支完成周期11、译码读寄存器12、ALUoutput←A op B ALUoutput←NPC + Imm13、分支 STORE指令14、ALU指令 LOAD指令15、单周期多周期16、重复设置指令执行功能部件流水17、吞吐率等功能非流水线18、通过时间排空时间19、流水线寄存器的延迟时钟扭曲20、数据相关控制相关21、结构相关数据相关22、结构数据23、硬件开销功能单元的延迟24、写后读读后写写后读25、写后读读后写26、PC值改变为分支转移的目标地址 PC值保持正常(等于当前值加4)27、目标地址分支转移条件不成立28、8 存储器29、多功能线性 830、水平处理方式垂直处理方式31、纵向处理方式纵横处理方式32、存储器向量寄存器33、访问存储器的次数对存储器带宽的要求34、每秒执行多少指令(MIPS)每秒取得多少个浮点运算结果(MFLOPS)35、512 836、链接技术向量循环或分段开采技术37、源向量结果向量38、向量功能部件标量寄存器向量寄存器块39、向量寄存器向量功能部件3.1 流水线的基本概念1、流水线:将一个重复的时序过程,分解为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其他子过程同时执行。
2、单功能流水线:只能完成一种固定功能的流水线。
3、多功能流水线:流水线的各段可以进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。
4、静态流水线:同一时间内,流水线的各段只能按同一种功能的连接方式工作。
5、动态流水线:同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。
第三章 流水线技术
第3章流水线技术3.1解释下列术语流水线:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。
单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。
多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。
静态流水线:指在同一时间内,多功能流水线中的各段只能按同一种功能的连接方式工作的流水线。
当流水线要切换到另一种功能时,必须等前面的任务都流出流水线之后,才能改变连接。
动态流水线:指在同一时间内,多功能流水线中的各段可以按照不同的方式连接,同时执行多种功能的流水线。
它允许在某些段正在实现某种运算时,另一些段却在实现另一种运算。
部件级流水线:把处理机中的部件进行分段,再把这些部件分段相互连接而成。
它使得运算操作能够按流水方式进行。
这种流水线也称为运算操作流水线。
处理机级流水线:又称指令流水线。
它是把指令的执行过程按照流水方式进行处理,即把一条指令的执行过程分解为若干个子过程,每个子过程在独立的功能部件中执行。
处理机间流水线:又称为宏流水线。
它是把多个处理机串行连接起来,对同一数据流进行处理,每个处理机完成整个任务中的一部分。
前一个处理机的输出结果存入存储器中,作为后一个处理机的输入。
线性流水线:指各段串行连接、没有反馈回路的流水线。
数据通过流水线中的各段时,每一个段最多只流过一次。
非线性流水线:指各段除了有串行的连接外,还有反馈回路的流水线。
顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。
乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。
这种流水线又称为无序流水线、错序流水线、异步流水线。
吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。
流水线的加速比:使用顺序处理方式处理一批任务所用的时间与按流水处理方式处理同一批任务所用的时间之比。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IF
ID
IF
EX
MEM
WB
IF ID IF EX ID IF MEM EX ID IF WB MEM EX ID WB MEM EX
stall stall
3、控制冲突
由分支指令引起的延迟称为分支延迟。 分支指令在目标代码中出现的频度很高,性能 损失很大。
据统计,每3~4条指令就有一条是分支指令。 假设:分支指令出现的频度是30%, 流水线理想 CPI=1, 那么:流水线的实际 CPI = 1.9。系统性能损失将 近50%!
分支指令 分支目标指令 分支目标指令+1 分支目标指令+2 分支目标指令+3 IF ID IF EX MEM WB IF ID IF EX ID IF MEM EX ID IF WB MEM EX ID WB MEM EX
stall stall
简单处理分支指令:分支失败的情况
分支指令
分支后继指令 分支后继指令+1 分支后继指令+2 分支后继指令+3
将计算结果写入R1
6
7
8
9
MEM WB EX MEM ID IF EX ID IF
WB MEM WB EX MEM WB ID EX MEM
读R1
WB
(1)数据相关冲突的3种类型
根据指令读访问和写访问的顺序,可以将数据 冲突分为3种类型: 考虑两条指令i和j ,且i在j之前进入流水线, 可能发生的数据冲突有:
写后读冲突(RAW):在 i 写入之前,j 先去读。
j 读出的内容是错误的。这是最常见的一种数据
冲突,它对应于真数据相关。
数据相关冲突的3种类型
写后写冲突(WAW):在 i 写入之前,j 先写。最
后写入的结果是i的。错误!这种冲突对应于输出 相关。 写后写冲突仅发生在这样的流水线中:
WB
i+2: i+3: i+4:
IF
ID
停顿
EX IF
MEM ID IF
WB EX ID
MEM WB EX MEM
WB
解决办法二
设置相互独立的指令存储器和数据存储器或 设置相互独立的指令Cache和数据Cache。
ID 段 Reg EX 段 MEM 段 DM WB 段 Reg
IF 段 IM
流水线寄存器
举例:请为下列表达式生成没有暂停的指令序列: A=B+C ; D=E-F ;
调度前的代码
LD LD ADD SD LD LD SUB SD Rb,B Rc,C Ra,Rb,Rc Ra,A Re,E Rf,F Rd,Re,Rf Rd,D LD LD LD ADD LD SD SUB SD
调度后的代码
Rb,B Rc,C Re,E Ra,Rb,Rc Rf,F Ra,A Rd,Re,Rf Rd,D
调度前执行情况(采用了定向技术)
LD LD SD LD LD Rb,B Rc,C Ra,A Re,E Rf,F IF ID EX MEM WB IF ID EX MEM WB IF ID 停 EX MEM WB IF 停 ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID 停 EX MEM WB
ADD Ra,Rb,Rc
SUB Rd,Re,Rf
SD
Rd,D
IF ID EX MEM WB
3、控制冲突
控制冲突 :指因为程序的执行方向可能被改 变而引起的流水线障碍。
BNEZ NEXT1:SUB ··· NEXT2:AND ···
BNEZ R13,NEXT2 IF ID
R13,NEXT2 R10,R11,R12 R10,R11,R12
WB
i+2: i+3: i+4:
IF
访存
ID IF
EX ID IF
MEM WB EX MEM WB ID EX MEM
WB
解决办法一
插入暂停周期,即停顿一拍流水线。通常是将 后一条指令停顿一拍后再启动。
1 2 ID IF 3 EX ID 4 5 6 7 8 9
i: IF i+1:
MEM WB EX MEM
依靠编译器解决数据冲突
让编译器重新组织指令顺序来消除冲突,这种技术称 为指令调度或流水线调度。 例如:表达式A=B+C计算过程
Rb,B IF ID EX MEM WB
LD
LD
Rc,C
IF
ID
IF
EX
ID IF
MEM
停顿 停顿
WB
EX ID MEM EX WB MEM WB
ADD Ra,Rb,Rc SD Ra ,A
时间(时钟周期) 1 ADD R1,R2,R3 IM 2 Reg 3 4 DM 5 Reg 6
ALU
ALU
SUB R4,R1,R5
IM
Reg
DM
Reg
ALU
XOR R6,R1,R7
IM
Reg
DM
ALU
AND R8,R1,R9
IM
Reg
OR R10,R1,R11
IM
Reg
采用定向技术后的流水线数据通路
WB
i+2: i+3: i+4:
IF
ID IF
EX ID IF
MEM WB EX MEM WB ID EX MEM
WB
后推法(停顿后继指令的执行) 通过定向技术解决写后读冲突 依靠编译器解决数据冲突
定向技术
定向技术也称为旁路技术、相关专用通路技术
关键思想:在某条指令产生计算结果之前,其他 指令并不真正立即需要该计算结果,如果能够将 该计算结果从其产生的地方直接送到其他指令需 要它的地方,那么就可以避免停顿。 i: IF i+1: i+2: i+3: i+4: ID IF EX MEM WB ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB
LOAD/STORE
取指令
转移类指令
取指令
IF
ID
EX
译码,读寄存器 译码,读寄存器 译码,读寄存器
执行运算 计算存储器有效 计算转移目标地 地址 址,设置条件码 读存储器/写存 若条件成立,转 储器 移目标地址送PC 空操作
MEM
空操作
WB
计算结果写回寄 读入数据写入寄 存器 存器
3.4.2 相关
3.4.2 相关
2、名相关
名:指令所访问的寄存器或存储器单元的 名称。 名相关:如果两条指令使用相同的名,但 是它们之间并没有数据流动,则称这两条 指令存在名相关。 名相关有两种:反相关和输出相关。
指令j与指令i之间的两种名相关
反相关:如果指令j写的名与指令i读的名相 同,则称指令i和j发生了反相关。如
相关:两条指令之间存在某种依赖关系。 如果两条指令相关,则它们就有可能不能 在流水线中重叠执行或者只能部分重叠执行。
相关有3种类型
数据相关(也称真数据相关)
名相关 控制相关
3.4.2 相关
1、数据相关
对于两条指令i(在前,下同)和j(在后, 下同),如果下述条件之一成立,则称指 令j与指令i数据相关。
EX
MEM
WB
?
IF
3、控制冲突
执行分支指令的结果有两种:
分支成功:PC值改变为分支转移的目标地址。在 条件判定和转移地址计算都完成后,才改变PC值。 不成功或者失败:PC的值保持正常递增,指向顺 序的下一条指令。
处理分支指令最简单的方法:“冻结”或者 “排空”流水线。
简单处理分支指令:分支成功的情况
功能部件不是完全流水或者资源不够用。 例如访存冲突
结构冲突举例:访存冲突
例1: ··· i: LOAD i+1: ADD i+2: SUB i+3: AND i+4: OR ··· 1 i: IF i+1: R1, X R2, R3, R4 R5, R6, R7 R8, R9, R10 R11,R12,R13 2 ID IF 3 EX ID 4访存 5 MEM WB EX MEM 6 7 8 9
S1; }; S; if p2 { S2; };
3.4.3 流水线冲突
流水线冲突是指对于具体的流水线来说,由于 相关的存在,使得指令流中的下一条指令不能 在指定的时钟周期执行。 流水线冲突有3种类型:
结构冲突 数据冲突 控制冲突
1、结构冲突
结构冲突(资源冲突):流水线中多条指令在 同一时钟周期内争用同一功能部件的现象。即 因硬件资源满足不了指令重叠执行的要求而发 生的冲突。 常见的导致结构相关的原因:
典型的程序结构—“if-then”结构
if p1 { S1; };
S; if p2 {
S2; };
控制相关带来了以下两个限制:
与一条分支指令控制相关的指令不能被移到 该分支之前,否则这些指令就不受该分支控 制了。 如果一条指令与某分支指令不存在控制相关, 就不能把该指令移到该分支之后。
if p1 {
指令j使用指令i产生的结果;
指令j与指令k数据相关,而指令k又与指令i
数据相关。
例如:下面这一段代码存在数据相关。
Loop: LD F0,0(R1) // F0为数组元素
ADD