超标量——计算机cpu处理技术

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

取指部件
译码部件
执行部件
流水线技术就是这样一种指令重叠执行的技术
2013年12月7日星期六
第六章 中央处理器
5
指令的几种执行方式
取指 分析 k 3t 顺序执行方式 第k + 2条指令 第k + 1条指令 第k条指令 取指 分析 3t 取指 执行 3t 一次重叠执行方式 第k + 2条指令 第k + 1条指令 第k条指令 取指 取指 取指 分析 执行 分析 执行 取指 分析 k+ 1 3t 执行
8
(3) 各部件运行时间不相等 这种情况所造成的影响可以用图形象地表示:
空闲时间 第k+2条指令 第k+1条指令 第k条指令 分析 分析 执行 执行
分析
执行
当分析和执行时间不相等时的重叠执行
2013年12月7日星期六
第六章 中央处理器
9
二、先行控制原理
先行指令栈 地 址 线 先行读数栈 运算控制器 指令分析器
2013年12月7日星期六
写k 写k+1 写k+2 写k+3 运k 运k+1 运k+2 运k+3 取k 取k+1 取k+2 取k+3 形k 形k+1 形k+2 形k+3 译k 译k+1 译k+2 译k+3 取k 取k+1 取k+2 取k+3
△t
2△t 3△t 4△t 5△t 第六章 中央处理器 6△t
9∆t
取指
执行
分析
执行
7∆t
分析 执行
执行
5∆t
分析
二次重叠执行方式
2013年12月7日星期六
第六章 中央处理器
6
一、指令的重叠执行
3.实现重叠执行必须解决的问题
(1) 各个部件独立控制 必须将统一的指令控制器分解成三个控制器: 存储控制器(存控):对存储器的存取 指令控制器(指控):控制指令分析器的工作 运算控制器(运控):控制指令执行过程
当工作频率受限于技术的进步时,并行处理技术可以大 大提高处理器的工作效能,同时由于频率没有提高,从 而也不会显著增加功耗
2013年12月7日星期六
第六章 中央处理器
14
超标量技术

超标量是通过内置多条流水线来同时执行 多个处理器,以实现一个周期内处理多条 指令,其实质是以空间换取时间。
2013年12月7日星期六
2013年12月7日星期六
第六章 中央处理器
19
超标量处理机

中央处理单元(CPU) 浮点处理单元(FPU)
2013年12月7日星期六
第六章 中央处理器
20
超标量体系结构

超标量体系结构 (superscalar architectures)超标量体系结构描述一种 微处理器设计,它能够在一个时钟周期执 行多个指令。在超标量体系结构设计中, 处理器或指令编译器能够判断指令能独立 于其它顺序指令而执行,还是依赖于另一 指令,必须跟其按顺序执行。
是否还有其它的问题?比如对存储器的访问是否会有 问题?
2013年12月7日星期六
第六章 中央处理器
7
一、指令的重叠执行
3.实现重叠执行必须解决的问题
(2) 存储器访问冲突:处理机中三个独立的部件正 在执行的是三条不同的指 令,他们很可能同时提出对 存储器读写的请求
2013年12月7日星期六
第六章 中央处理器
2013年12月7日星期六
第六章 中央处理器
21
超标量体系结构


处理器然后使用多个执行单元同时执行两 个或更多独立指令。超标量体系结构设计 有时称“第二代RISC”。 涉及计算机智能化,要求较高
2013年12月7日星期六
第六章 中央处理器
22
CPU发展历史

第1阶段(1971——1973年)是4位和8 位低档微处理器时代,通常称为第1代,其 典型产品是Intel4004和Intel8008微处理 器。(1971年计算机发展进入第四代,大 超大规模集成电路计算机)

第6阶段(2005年至今)是酷睿(core) 系列微处理器时代,通常称为第6代。
2013年12月7日星期六
第六章 中央处理器
28
查询自己电脑的CPU型号
2013年12月7日星期六
第六章 中央处理器
29
2013年12月7日星期六
第六章 中央处理器
30
2013年12月7日星期六
第六章 中央处理器
7△t
8△t
9△t
时间
12
三、流水线工作原理

影响流水线性能的因素:
• 局部相关(先写后读相关)
k 指令入 j i h
1
2 读数
3
4
5
6
7
写数
8
结果出
MEM
• 全局相关:转移指令、中断带来的影响
2013年12月7日星期六
第六章 中央处理器
13
微处理器中的新技术


超标量技术 超线程技术 多核技术 超流水线技术
§6 流水线技术

CPU的工作过程
取指令
一条指令的
分析指令 执行指令 取指令
执行过程
一条指令的
分析指令 执行指令
执行过程

2013年12月7日星期六
第六章 中央处理器
1
§6 流水线技术
CPU i MEM j k
取指部件
译码部件
执行部件
2013年12月7日星期六
第六章 中央处理器
2
§6 流水线技术
2013年12月7日星期六
第六章 中央处理器
23
CPU发展历史

第2阶段(1974——1977年)是8位中高 档微处理器时代,通常称为第2代,其典型 产品是Intel8080/8085、Motorola公司 、Zilog公司的Z80等。
2013年12月7日星期六
第六章 中央处理器
24
CPU发展历史

第3阶段(1978——1984年)是16位微 处理器时代,通常称为第3代,其典型产品 是Intel公司的8086/8088,Motorola公 司的M68000,Zilog公司的Z8000等微处 理器。
2013年12月7日星期六
第六章 中央处理器
25
Fra Baidu bibliotek CPU发展历史



第4阶段(1985——1992年)是32位微 处理器时代,又称为第4代。 1989年,我们大家耳熟能详的80486芯片 由英特尔推出。 在80x86系列中首次采用了RISC(精简指 令集)技术,可以在一个时钟周期内执行 一条指令。
CPU i MEM j k
取指部件
译码部件
执行部件
2013年12月7日星期六
第六章 中央处理器
3
§6 流水线技术
其实指令的执行还可以这样:
CPU i MEM j k
取指部件
译码部件
执行部件
2013年12月7日星期六
第六章 中央处理器
4
§6 流水线技术
其实指令的执行甚至可以这样:
CPU i MEM j k
2013年12月7日星期六
第六章 中央处理器
26
CPU发展历史

第5阶段(1993-2005年)是奔腾( pentium)系列微处理器时代,通常称为 第5代。典型产品是Intel公司的奔腾系列 芯片及与之兼容的AMD的K6、K7系列微处 理器芯片。
2013年12月7日星期六
第六章 中央处理器
27
CPU发展历史
去 主 存 储 器
存 储 控 制 器
先行操作栈
通 用 寄 存 器
后行写数栈
运算器
采用先行控制方式的处理机框图
2013年12月7日星期六 10
第六章 中央处理器
三、流水线工作原理
建立在重叠执行、先行控制的基础上,依据 指令的处理步骤,将处理机分解成一系列独立的 工作部件(+锁存器),让指令顺序地通过各个 部件,完成该指令的处理全过程,这就是流水线 结构的处理机。
2013年12月7日星期六
第六章 中央处理器
11
三、流水线工作原理
指 令 入 取指令 译码 形成操作 数地址 取操作数 算逻运算
处理步骤分割得越 细,指令执行的并 行度越高
保存结果
结 果 出

时空图——描述流水线工作过程
空间 平均每条指令执 行时间为△t
写回 运算 取数 形成操作数地址 译码 取指
第六章 中央处理器
15
2013年12月7日星期六
第六章 中央处理器
16
对比 超标量与简单的流水线技术
2013年12月7日星期六
第六章 中央处理器
17
对比 超标量与超流水线技术
2013年12月7日星期六
第六章 中央处理器
18

P e n t i u m、Pentium Pro和Pentium II处理器的超标量设计更是分别结合了两条 和三条独立的指令流水线,每条流水线平 均在一个时钟周期内执行一条指令,所以 它们平均一个时钟周期分别可执行2条和3 条指令。
31
2013年12月7日星期六
第六章 中央处理器
32
2013年12月7日星期六
第六章 中央处理器
33
本章小结
重点内容: 超线程的工作原理和实现方法
超标量与超流水的区别
简要介绍CPU相关知识
2013年12月7日星期六
第六章 中央处理器
34
相关文档
最新文档