计算机组成原理第10章-09
计算机组成原理第二版课后习题答案
计算机组成原理第二版课后习题答案第1章计算机系统概论1.什么是计算机系统、计算机硬件和计算机软件?硬件和软件哪个更重要?解:硬件和软件在计算机系统中相互依存,缺一不可,因此同样重要。
2.如何理解计算机的层次结构?答:计算机硬件、系统软件和应用软件构成了计算机系统的三个层次结构。
(1)硬件系统是最内层的,它是整个计算机系统的基础和核心。
(2)系统软件在硬件之外,为用户提供一个基本操作界面。
(3)应用软件在最外层,为用户提供解决具体问题的应用系统界面。
通常将硬件系统之外的其余层称为虚拟机。
各层次之间关系密切,上层是下层的扩展,下层是上层的基础,各层次的划分不是绝对的。
言的符号表示,高级语言是面向算法的语言。
高级语言编写的程序(源程序)处于最高层,必须翻译成汇编语言,再由汇编程序汇编成机器语言(目标程序)之后才能被执行。
4.如何理解计算机组成和计算机体系结构?答:计算机体系结构是指那些能够被程序员所见到的计算机系统的属性,如指令系统、数据类型、寻址技术组成及I/O机理等。
计算机组成是指如何实现计算机体系结构所体现的属性,包含对程序员透明的硬件细节,如组成计算机系统的各个功能部件的结构和功能,及相互连接方法等。
5.冯诺依曼计算机的特点是什么?解:冯诺依曼计算机的特点是:P8计算机由运算器、控制器、存储器、输入设备、输出设备五大部件组成;指令和数据以同同等地位存放于存储器内,并可以按地址访问;指令和数据均用二进制表示;指令由操作码、地址码两大部分组成,操作码用来表示操作的性质,地址码用来表示操作数在存储器中的位置;指令在存储器中顺序存放,通常自动顺序取出执行;机器以运算器为中心(原始冯诺依曼机)。
6.画出计算机硬件组成框图,说明各部件的作用及计算机系统的主要技术指标。
答:计算机硬件组成框图如下:控制器运算器CPU存储器接口接口输入设备主机外设输出设备各部件的作用如下:控制器:整机的指挥中心,它使计算机的各个部件自动协调工作。
计算机组成原理(白中英)
D0
D1
D2
D3
A校验码 B校验码 C校验码 D校验码
系统结构
RAID4
I/O系统
❖ 专用奇偶校验独立存取盘阵列
❖ 数据以块(块大小可变)交叉的方式存于各盘, 奇偶校验信息存在一台专用盘上
数据块
校验码 产生器
A0
A1
A2
A3
B0
B1
B2
B3
C0
C1
C2
C3
D0
D1
D2
D3
A校验码 B校验码 C校验码 D校验码
❖ 只写一次光盘
只写一次光盘(Write Once Only):可以由用户写入 信息,不过只能写一次,写入后不能修改,可以多次读 出,相当于PROM。在盘片上留有空白区,可以把要修 改和重写的的数据追记在空白区内。
❖ 可檫写式光盘
可檫写式光盘(Rewriteable):利用磁光效应存取信 息,采纳特殊的磁性薄膜作记录介质,用激光束来记录、 再现和删除信息,又称为磁光盘,类似于磁盘,可以重 复读写。
RAID6
I/O系统
❖ 双维奇偶校验独立存取盘阵列
❖ 数据以块(块大小可变)交叉方式存于各盘, 检、纠错信息均匀分布在全部磁盘上
系统结构
A0 A1 A2
3校验码 D校验码
B0 B1
2校验码 C校验码
B2
C0
1校验码 B校验码
C1 C2
0校验码 A校验码
D1 D2 D3
校验码 产生器
7.7 光盘存储设备
– 正脉冲电流表示“1”,负脉冲电流表示“0”; – 不论记录“0”或“1”,在记录下一信息前,记录电流
恢复到零电流 – 简洁易行,记录密度低,改写磁层上的记录比较困难,
计算机组成原理唐朔飞(第2版)课后习题-控制单元的设计(圣才出品)
5.假设 CPU 在中断周期用堆栈保存程序断点,而且进栈时指针减 1(具体操作是先修 改栈指针后存数),出栈时指针加 1。分别写出组合逻辑控制和微程序控制在完成中断返回 指令时,取指阶段和执行阶段所需的全部微操作命令及节拍安排。
答:假设进栈操作是先修改堆栈指针后存数,则出栈操作是先读数后修改堆栈指针。 (1)完成中断返回指令组合逻辑控制的微操作命令及节拍安排: 取指阶段
执行阶段:
(2)完成中断返回指令微程序控制的微操作命令及节拍安排:
取指阶段
T0
PC→MAR,1→R
T1
Ad(CMDR)→CMAR
T2
M(MAR)→MDR,(PC)+1→PC
T3
Ad(CMDR)→CMAR
T4
MDR→IR
5 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台
执行周期:
⑤STP 指令所需全部微操作命令及节拍安排: 取指周期:
3 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台
执行周期:
4.在单总线结构的计算机中,用该总线连接了指令寄存器 IR、程序计数器 PC、存储 器地址寄存器 MAR、存储器数据寄存器 MDR、通用寄存器 R0~R7 的输入和输出端。ALU 的两个输入端分别与总线和寄存器 Y 的输出端相连,ALU 的输出端与寄存器 2 的输入端相 连。Y 的输入端与总线连接,2 的输出端与总线连接该机有下列指令:
T5
OP(IR)→微地址形成部件→CMAR
执行阶段
6.已知带返转指令的含义如下所示,写出机器在完成带返转指令时,取指阶段和执行 阶段所需的全部微操作及节拍安排。
答:取指周期:
计算机组成原理
1.3 计算机的基本组成
1.3.1冯.诺依曼计算机的特点
1. “存储程序”的概念: • 指令和数据均以二进制码表示。 • 指令由操作码和地址码组成,操作码用来表示操作的性质,地址码 用来表示操作数所在存储器的位臵。 • 指令在存储器内按顺序存放。通常,指令是顺序执行的,在特定条 件下,可根据运算结果或根据设定的条件改变执行顺序。 控制器 冯.诺依曼对计算机界的最大贡献是: 主存区 PC 首次提出并实现了“存储程序”概念。 译码器 +1 本书主要介绍冯.诺依曼 读指令 程序(指令)区 结构计算机的组成。 ︾ ︾ 操作码 操作数地址
1.3.4 计算机的工作过程
3.指令的执行 指令规定的内容是通过控制器执行的。 ⑴ 控制器的功能 ① 定序功能——保证按程序规定的顺序执行指令。 ② 定时功能——控制器为各部件提供统一节拍,使各 条指令及组成每条指令的基本操作(称为微操作) 都严格地按规定的时间有条不紊地自动执行。 ③ 操作控制功能——控制器应能按照指令规定的内容, 在相应的节拍向有关部件发出操作控制信号。
操作系统 硬件
计算机 系统
互 补
系统软件
语言处理 程序 工具软件
软件
文字处理 数据处理
应用软件
程序
+
文档
计算机辅助 软件
……
计算机系统的软件分类
应用软件和工具软件三大类。
1.1.2 计算机系统的层次结构
1.虚拟机(Virtual Machine)的概念
应用语言虚拟机M5(应用语言)用应用语言编写 的应用语言程序经应用程序包翻译成高级语言 翻译(应用软件包)
硬件直接执行
计算机系统的层次结构图
2.虚拟机的层次结构
从语言的角度来划分计算机系统的层次结构,那么 虚拟机可分成如图1-2所示的操作系统虚拟机、汇编语言 虚拟机、高级语言虚拟机和应用程序虚拟机等层次。 虚拟机概念的引入,推动了计算机体系结构的发展。 由于从各层次的虚拟机可方便地识别相应层次的计算机 语言,从而摆脱了这些语言必须在同一台机器上执行的 情况,为日后的多处理机系统、分布式处理系统、计算 机网络、并行计算机系统等新颖计算机体系结构的出现 夯实了基础。 虚拟计算机 广义语言 本书讨论的范围 控制信息 仅局限于传统机器M1和 观察者 解释器 作用对象 微程序机器M0的组成原理 状态信息 和设计思想。
计算机组成原理10 第十章 CU的设计(2)
⑨ JMP X
T0
T1 T2 Ad ( IR ) PC
⑩ BAN X
T0
T1 T2 A0 • Ad ( IR ) + A0• PC PC
5. 中断周期 微操作的 节拍安排
T0
T1 T2
10.1
硬件关中断
0
PC MDR
MAR
MDR M ( MAR )
1
W
向量地址
PC
中断隐指令完成
三、组合逻辑设计步骤
T0
EX 执行
1
1 T1
M(MAR) AC
W
(AC)+(MDR) AC T2
MDR
MDR 0
M(MAR)
AC AC 1
1
2. 写出微操作命令的最简表达式
M ( MAR ) MDR
10.1
= FE · 1 + IND · 1 ( ADD + STA + LDA + JMP + BAN ) T T + EX · 1 ( ADD +LDA ) T = T1{ FE + IND ( ADD + STA + LDA + JMP + BAN ) + EX ( ADD +LDA ) }
10.1
微操作命令信号 CLA COM ADD SAT LDA JMP PC 1 M(MAR) ( PC ) +1 MDR OP( IR ) MAR R MDR PC IR ID IND EX 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
FE 取指
T0 T1 T2 PC 1 R MDR PC IR ID
计算机组成原理目录
计算机组成原理目录目录如下:第1篇概论第1章计算机系统概论1.1 计算机系统简介1.1.1 计算机的软硬件概念1.1.2 计算机系统的层次结构1.1.3 计算机组成和计算机体系结构1.2 计算机的基本组成1.2.1 冯·诺依曼计算机的特点1.2.2 计算机的硬件框图1.2.3 计算机的工作步骤1.3 计算机硬件的主要技术指标1.3.1 机器字长1.3.2 存储容量1.3.3 运算速度1.4 本书结构思考题与习题第2章计算机的发展及应用2.1 计算机的发展史2.1.1 计算机的产生和发展2.1.2 微型计算机的出现和发展2.1.3 软件技术的兴起和发展2.2 计算机的应用2.2.1 科学计算和数据处理2.2.2 工业控制和实时控制2.2.3 网络技术的应用2.2.4 虚拟现实2.2.5 办公自动化和管理信息系统2.2.6 CAD/CAM/CIMS2.2.7 多媒体技术2.2.8 人工智能2.3 计算机的展望思考题与习题第2篇计算机系统的硬件结构第3章系统总线3.1 总线的基本概念3.2 总线的分类3.2.1 片内总线3.2.2 系统总线3.2.3 通信总线3.3 总线特性及性能指标3.3.1 总线特性3.3.2 总线性能指标3.3.3 总线标准3.4 总线结构3.4.1 单总线结构3.4.2 多总线结构3.4.3 总线结构举例3.5 总线控制3.5.1 总线判优控制3.5.2 总线通信控制思考题与习题第4章存储器4.1 概述4.1.2 存储器的层次结构4.2 主存储器4.2.1 概述4.2.2 半导体存储芯片简介4.2.3 随机存取存储器4.2.4 只读存储器4.2.5 存储器与CPU的连接4.2.6 存储器的校验4.2.7 提高访存速度的措施4.3 高速缓冲存储器4.3.1 概述4.3.2 Cache—主存地址映射4.3.3 替换策略4.4.1 概述4.4.2 磁记录原理和记录方式4.4.3 硬磁盘存储器4.4.4 软磁盘存储器4.4.5 磁带存储器4.4.6 循环冗余校验码4.4.7 光盘存储器思考题与习题附录4A 相联存储器第5章输入输出系统5.1 概述5.1.1 输入输出系统的发展概况5.1.2 输入输出系统的组成5.1.3 I/O设备与主机的联系方式5.1.4 I/O设备与主机信息传送的控制方式5.2 I/O设备5.2.1 概述5.2.2 输入设备5.2.3 输出设备5.2.4 其他I/O设备5.2.5 多媒体技术5.3 I/O接口5.3.1 概述5.3.2 接口的功能和组成5.3.3 接口类型5.4 程序查询方式5.4.1 程序查询流程5.4.2 程序查询方式的接口电路5.5 程序中断方式5.5.1 中断的概念5.5.2 I/O中断的产生5.5.3 程序中断方式的接口电路5.5.4 I/O中断处理过程5.5.5 中断服务程序的流程5.6 DMA方式5.6.1 DMA方式的特点5.6.2 DMA接口的功能和组成5.6.3 DMA的工作过程5.6.4 DMA接口的类型思考题与习题附录5A ASCⅡ码附录5B BCD码附录5C 奇偶校检码第3篇中央处理器第6章计算机的运算方法6.1 无符号数和有符号数6.1.1 无符号数6.1.2 有符号数6.2 数的定点表示和浮点表示6.2.1 定点表示6.2.2 浮点表示6.2.3 定点数和浮点数的比较6.2.4 举例6.2.5 IEEE754标准6.3 定点运算6.3.1 移位运算6.3.2 加法与减法运算6.3.3 乘法运算6.3.4 除法运算6.4 浮点四则运算6.4.1 浮点加减运算6.4.2 浮点乘除法运算6.4.3 浮点运算所需的硬件配置6.5 算术逻辑单元6.5.1 ALU电路6.5.2 快速进位链思考题与习题附录6A 各种进位制6A.1 各种进位制的对应关系6A.2 各种进位制的转换附录6B 阵列乘法器和阵列除法器附录6C 74181逻辑电路第7章指令系统7.1 机器指令7.1.1 指令的一般格式7.1.2 指令字长7.2 操作数类型和操作类型7.2.1 操作数类型7.2.2 数据在存储器中的存放方式7.2.3 操作类型7.3 寻址方式7.3.1 指令寻址7.3.2 数据寻址7.4 指令格式举例7.4.1 设计指令格式应考虑的各种因素7.4.2 指令格式举例7.4.3 指令格式设计举例7.5 RISC技术7.5.1 RISC的产生和发展7.5.2 RISC的主要特征7.5.3 RISC和CISC的比较思考题与习题第8章 CPU的结构和功能8.1 CPU的结构8.1.1 CPU的功能8.1.2 CPU结构框图8.1.3 CPU的寄存器8.1.4 控制单元和中断系统8.2 指令周期8.2.1 指令周期的基本概念8.2.2 指令周期的数据流8.3 指令流水8.3.1 指令流水原理8.3.2 影响流水线性能的因素8.3.3 流水线性能8.3.4 流水线中的多发技术8.3.5 流水线结构8.4 中断系统8.4.1 概述8.4.2 中断请求标记和中断判优逻辑8.4.3 中断服务程序入口地址的寻找8.4.4 中断响应8.4.5 保护现场和恢复现场8.4.6 中断屏蔽技术思考题与习题第4篇控制单元第9章控制单元的功能9.1 微操作命令的分析9.1.1 取指周期9.1.2 间址周期9.1.3 执行周期9.1.4 中断周期9.2 控制单元的功能9.2.1 控制单元的外特性9.2.2 控制信号举例9.2.3 多级时序系统9.2.4 控制方式9.2.5 多级时序系统实例分析思考题与习题第10章控制单元的设计10.1 组合逻辑设计10.1.1 组合逻辑控制单元框图10.1.2 微操作的节拍安排10.1.3 组合逻辑设计步骤10.2 微程序设计10.2.1 微程序设计思想的产生10.2.2 微程序控制单元框图及工作原理10.2.3 微指令的编码方式10.2.4 微指令序列地址的形成10.2.5 微指令格式10.2.6 静态微程序设计和动态微程序程序设计10.2.7 毫微程序设计10.2.8 串行微程序控制和并行微程序控制10.2.9 微程序设计举例思考题与习题附录10A PC整机介绍10A.1 主板10A.1.1 主板的主要组成部件10A.1.2 CPU芯片及插座(插槽)10A.1.3 内存条插槽10A.1.4 扩展插10A.1.5 配套芯片和器件10A.1.6 主板结构的改进10A.2 芯片组10A.2.1 芯片组的功能10A.2.2 芯片组的组成《计算机组成原理》是2008年1月1日高等教育出版社出版的图书,作者是唐朔飞。
计算机组成原理课后习题答案(一到九章)
计算机组成原理课后习题答案(一到九章) 作业解答第一章作业解答1.1 基本的软件系统包括哪些内容?答:基本的软件系统包括系统软件与应用软件两大类。
系统软件是一组保证计算机系统高效、正确运行的基础软件,通常作为系统资源提供给用户使用。
包括:操作系统、语言处理程序、数据库管理系统、分布式软件系统、网络软件系统、各种服务程序等。
1.2 计算机硬件系统由哪些基本部件组成?它们的主要功能是什么?答:计算机的硬件系统通常由输入设备、输出设备、运算器、存储器和控制器等五大部件组成。
输入设备的主要功能是将程序和数据以机器所能识别和接受的信息形式输入到计算机内。
输出设备的主要功能是将计算机处理的结果以人们所能接受的信息形式或其它系统所要求的信息形式输出。
存储器的主要功能是存储信息,用于存放程序和数据。
运算器的主要功能是对数据进行加工处理,完成算术运算和逻辑运算。
控制器的主要功能是按事先安排好的解题步骤,控制计算机各个部件有条不紊地自动工作。
1.3 冯・诺依曼计算机的基本思想是什么?什么叫存储程序方式?答:冯・诺依曼计算机的基本思想包含三个方面:1) 计算机由输入设备、输出设备、运算器、存储器和控制器五大部件组成。
2) 采用二进制形式表示数据和指令。
3) 采用存储程序方式。
存储程序是指在用计算机解题之前,事先编制好程序,并连同所需的数据预先存入主存储器中。
在解题过程(运行程序)中,由控制器按照事先编好并存入存储器中的程序自动地、连续地从存储器中依次取出指令并执行,直到获得所要求的结果为止。
1.4 早期计算机组织结构有什么特点?现代计算机结构为什么以存储器为中心?答:早期计算机组织结构的特点是:以运算器为中心的,其它部件都通过运算器完成信息的传递。
随着微电子技术的进步,人们将运算器和控制器两个主要功能部件合二为一,集成到一个芯片里构成了微处理器。
同时随着半导体存储器代替磁芯存储器,存储容量成倍地扩大,加上需要计算机处理、加工的信息量与日俱增,以运算器为中心的结构已不能满足计算机发展的需求,甚至会影响计算机的性能。
计算机组成原理第10章实训PPT课件
• 的进位结果锁存到进位锁存器中。
2007.7.2
19
第19页/共83页
图10-6 进位控制实训接线 (上图方格内竖线不需要)
2007.7.2
20
第20页/共83页
•电路并检查无误。
•
②打开电源开关。
•
③用输入开关向暂存器DR1和DR2置数。操作
• 流程如图10-5所示。
2007.7.2
14
第14页/共83页
•
c. 按动微动开关KK2(产生T4脉冲信号),与
• LDDR1信号一起,将二进制数01100101置入DR1
• 中。
•
③输入开关向暂存器DR2置数,操作流程如图
• 10-5所示。
•
a. 拨动输入开关形成二进制数10100111(或
• 其它数值)。(数据显示灯亮为0,灭为1)。
F=A+ A B+1 F=A B +(A|B)+1
F=A-B F=A B F=A+AB+1 F=A+B+1 F=AB+(A| B )+1 F=AB F=A+A+1 F=A+(A| B )+1 F=A+(A+ B )+1 F=A
M=1(逻辑运算)
F=A F=A|B F=A B F=0 F=AB F=B F=A⊕B F=A B F= A +B F=A ⊕ B F=B F=AB F=1 F=A+ B F=A+B F=A
18
第18页/共83页
• 2. 进位控制运算
• (1)实训说明
•
进位控制运算器的实训原理如图10-3所示,
计算机组成原理课后答案(第二版)_唐朔飞_第十章
3. 按序写出下列程序所需的全部 按序写出下列程序所需的全部 微操作命令及节拍安排。 微操作命令及节拍安排。 指令地址 300 301 302 303 304 指令 LDA 306 ADD 307 BAN 304 STA 305 STP
解:由于题意未明确要求采用何种 由于题意未明确要求 未明确要求采用何种 控制器结构, 控制器结构,故仍按较简单的组合逻辑 时序关系安排节拍(单总线、同步控制, 时序关系安排节拍(单总线、同步控制, 假设同上题): 假设同上题): LDA 306 指令: 指令: 取指周期: 取指周期: T0 PC→MAR,1→R PC→MAR, T1 PC+1,M(MAR)→MDR PC+1,M(MAR)→ T2 MDR→IR,OP(IR)→ID MDR→IR,OP(IR)→ 执行周期: 执行周期: T0 306(IR)→MAR,1→R 306(IR)→MAR, T1 M(MAR)→MDR M(MAR)→ T2 MDR→AC MDR→
ADD 307 指令:取指周期:同上。 指令:取指周期:同上。 执行周期1 执行周期1: T0 307(IR)→MAR,1→R 307(IR)→MAR, T1 M(MAR)→MDR,AC→C M(MAR)→MDR,AC→ T2 MDR→D MDR→ 执行周期2 执行周期2: T0 T1 T2 +,ALU→AC +,ALU→ BAN 304 指令:取指周期:同上。 指令:取指周期:同上。 执行周期: 为结果为负标志) 执行周期: (设N为结果为负标志) T0 T1 T2 N·304(IR)→PC N·304(IR)→
(2) SUB R1,R3指令周期流程图如下: 指令周期流程图如下: ↓ PCo,G,MARi PC→MAR → ↓ MM读 读 1 →R ↓ PC+1 →PC +1(可与前一步并行) +1( ↓ MDR →IR MDRo,G,IRi ↓ OP=? OP=? ↓SUB
计算机组成原理复习题及答案
第3章6、二进制左移一位,则数值_a____;二进制右移一位,则数值__b_____;a增大一倍 b减小一倍 c增大10倍 b减小10倍7、8位二进制无符号定点整数能表示的数值范围是 d ,8位二进制补码定点整数能表示的数值范围是 a ;a-128~127 b –127~127 c0~127 d 0~255 e 0~2568、8位原码能表示的数据个数是 c ;8位补码能表示的数据个数是d ;a127 b128 c255 d256第4章1 DRAM地址分两次输入行选通RAS、列选通CAS的目的是_b________;a缩短读/写时间 b减少芯片引出端线数 c刷新第5章9 在指令系统中采用 b 寻址方式的指令其长度最短;a立即数 b寄存器 c直接 d变址10、一条指令字长16位,存储器按字节编址,在读取一条指令后,PC的值自动加__b____;a1 b2 c4 d-111、某计算机存储器按字16位编址,每取出一条指令后PC值自动+1,说明其指令长度是___b_____;a1个字节 b2个字节 c4个字节第6章7、在取指令操作完成之后,PC中存放的是 c ;a)当前指令的地址b)下一条实际执行的指令地址c)下一条顺序执行的指令地址PC+1d)对于微程序控制计算机,存放的是该条指令的微程序入口地址;8、控制存储器用来存放__d_____;a机器指令和数据 b微程序和数据 c机器指令和微程序 d微程序第8章3、在大多数磁盘存储器中,以下正确的是_b__;a各个磁道的位密度相等 b内圈磁道的位密度较大c外圈磁道的位密度较大 c磁盘读写信息的最小单位是字节4 大多数情况下,对于磁盘,以下叙述正确的是__d___;a依靠磁盘的旋转定位磁道 b依靠磁臂的移动定位扇区c外圈磁道与内圈磁道的容量不同d访问磁道的地址用盘面号、磁道号和扇区号来表示;扇区是最小访问单元; 第10章4、指令执行结果出现异常引起的中断是__a___中断;键盘发出的中断是___b_____;a内部 b外部 c软件5、键盘输入输出适用于采用__b___;a程序查询 b程序中断或字节多路通道cDMA d选择通道6、在多重中断情况下,CPU现场信息可保存在__c___中;a通用寄存器 b控制存储器c堆栈 d外设接口7、以下叙述中正确的是__a_____;a)中断方式一般用于处理随机出现的服务请求b)外部设备发出中断应立即得到CPU的响应c)中断方式可用于CPU向外部设备的请求d)DMA也可用于在主存与主存之间传送数据8、磁盘设备适宜于连接到__c___通道;a)字节多路通道或数据组多路通道b)字节多路通道或选择通道c)数组多路通道或选择通道d)任一种9、通道处理机不具备_d____功能;a程序控制 b中断 cDMA d数据运算10、在外设接口中,控制器的作用是_a___;状态寄存器的作用是__c_____; a存放CPU给外设的操作命令 b存放外设给CPU的操作命令c存放外设的工作状态 d存放CPU的工作状态11、在以下的叙述中,不正确的是_d___;a)在总线中,缩短总线长度有利于提高总线数据传输速度b)在系统总线中,通常一个总线工作周期是先传送地址,后传输数据c)在总线接口中,设备地址选择器的作用是判断CPU送来的地址是否是本接口的地址d)总线的同步通信方式运用于速度差异较大的部件之间的通信第3章数据编码和运算方法1、数据,表示原码时其真值为_-0_____,表示补码时其真值为__-1____,表示反码时其真值为;2、X补=,X反=,X补=,X反=,其原码分别为、、和按顺序回答3、已知X补=11101,X/2补= 11110 不舍入,2X补= 11010 ;4、数据01101101的奇校验位为_0____,偶校验位为__1____;5、了进行算术运算,运算部件中至少要有___3_____个寄存器;其中存放乘数和上商的寄存器要有______移位___功能,加法器向存放部分积或余数的寄存器传送数据;要具有____直送__、____向左斜送___和____向右斜送____功能;否则存放部分积或余数的寄存器要有____移位____功能,采用斜送方法比移位方法更节省___时间___,因为它在传送时就完成了移位操作;第4章主存储器1、半导体随机存储器可分为_SRAM_和__DRAM__两种;2、启动一次存储器读/写操作到完成读/写操作的时间称为_ 读写时间___;连续启动两次读/写操作所需的最小时间间隔称为_存储周期______;3、DRAM为保持其信息需要定时进行刷新 ;刷新方式有集中式和分散式或分布式 ;4、设某存储器的容量是MN位,采用LK位存储器芯片,该存储器所需的芯片数为_M/L N/K__________;5、某计算机指令地址长度为32位,主存储器容量为128MB,则可访问主存的地址长度为 27 位,可访问的地址范围为0到 128M ;第5章指令系统1、一般机器指令由操作码和地址码组成;2、指令的地址码字段存放的内容及其编码方式称为操作数据的寻找方式 ;3、在单地址运算指令例如加法指令中,一个操作数由地址码给出,另一个操作数在累加器中,运算结果存入累加器 ;4、操作数在主存储器中,存储器地址直接在指令中给出,这是直接寻址方式;操作数的地址在主存储器中,这是间接寻址方式;操作数的地址在寄存器中,这是寄存器间接寻址方式;5、操作数地址为程序计数器的内容加上偏移量,该偏移量由指令的地址码给出,这是相对寻址方式;6、设相对转移指令占两个字节,第1个字节为操作码,第2个字节是相对偏移量用补码表示,设该指令的地址为2003H按字节编址,要求转移到2008H,该指令的相对位移量为 00000011或00000101 用二进制表示;若指令的地址为2008H,要求转移到2001H,相对位移量为二进制表示;7、某一个自底向上生成的存储器堆栈,堆栈指针是SP,在数据进入堆栈时,先进行 SP-2→SP 操作,然后进行进栈操作;数据推出堆栈时,先进行出栈操作,然后进行 SP+2→SP 操作;已知数据字长为2字节,存储器按字节编址;8、Load功能是将数据从___存储器______传送到__寄存器________;store指令的功能是将数据从___寄存器_________传送到__存储器________;第6章中央处理器1、控制器中必有的两个寄存器是程序计数器PC 和指令寄存器IR ;2、在非流水线计算机中,一个指令周期是由若干个机器周期组成的;一个机器周期可以等于一个或多个时钟周期;时钟频率一般称为主频 ;3、完成一条指令的一系列微指令的有序集合称为微程序 ;4、微指令分两个字段,它们是控制字段和下址字段 ;5、在硬连线控制器中,控制信号形成电路根据指令译码信息、机器周期Ti 、和条件状态信息产生控制信号;6、连接CPU和存储器的信号线按功能划分有地址线、数据线和控制线;第7章存储系统1、三级存储器系统是cache 、主存储器和辅助存储器 ;2、对cache进行读写时,需将主存地址变换成cache地址,这种变换过程称为地址映像 ;3、访问主存的指令和数据存在于cache中称为命中 ;命中的次数与访存次数之比称为命中率 ;4、如果cache的容量是256块,采用直接映像,主存中的第i块映像到cache 的第 imod 256 块;5、cache与主存的地址映像有直接映像、全相联映像和组相联映像 ;6、一个组相联映像的cache,有64个页面,每组4个页面,主存共有4096个页面,每个页面64个字,因而在主存地址中,应有标记字段 8 位,组地址字段 4 位,页面字段 2 位,主存地址总长度 20 位按字编址; 注:页面即本章所讲述的“块”;7、存储器的管理方式有段式、页式和段页式 ;其中页的长度是固定的,段的长度是可变的;8、在cache组相联存储器中,假设c’为组字段长度,r为块字段长度;当r=0时,则成为直接地址映像,当c’=0时,则成为全相联地址映像;9、以下叙述正确的是__c_和__e______;a)主存的存取速度可以与CPU匹配b)主存由RAM构成,不包括ROMc)辅存中的程序调入主存后才能运行d)如果指令的地址码为24位,那么主存容量必是16MBe)汇编语言程序设计需要了解计算机的硬件结构10、采用cache、内存分页段管理和虚拟存储器技术时,在执行程序过程中都有地址映射问题;对于cache一般是从___c_____映射成___d______;对于内存分页分段管理,从___e_______映射成___c________;对于虚拟存储器是从__fe______映射成___c________;a绝对地址 b相对地址 c物理地址 dcache地址e逻辑地址 f虚拟地址 g程序地址第8章辅助存储器1、在磁盘存储器的速度指标中, 平均等待时间和数据传输率与磁盘的旋转速度有关;2 、存储器按读写方式可分为随机存取、直接存取和顺序存取3种,半导体存储器、磁盘存储器、磁带存储器 3种存储器分别依次属于上述3种方式;第10章 I/O系统12、外设地址有两种表示法:一种是_统一编址___,是利用_访存___指令进行输入输出操作的;另一种是_独立编址_______,它是利用_I/O_指令进行输入输出操作的;13、通道的类型有字节多路__通道、_数组多路____通道和__选择____通道;通用微机是否可采用Flash memory作为主存答:不能;闪存并不能支持原位更新, 向闪存中写入一条数据对这个数据块先执行擦除操作后, 这个页中的原有数据也需要重写到这个块中, 所以擦除操作所消耗的时间要远远大于写操作所要执行的时间;设有主频为16MHz的微处理器,平均每条指令的执行时间为两个机器周期,每个机器周期由两个时钟脉冲组成;问:1存储器为“0等待”,求出机器速度;2假如每两个机器周期中有一个是访存周期,需插入1个时钟周期的等待时间,求机器速度;“0等待”表示存储器可在一个机器周期完成读/写操作,因此不需要插入等待时间答:1 机器速度=主频/平均每条指令占的时钟脉冲数=16/22=4MIPS2机器速度=16/2+2+1=设某流水线计算机有一个指令和数据合一的cache,已知cache的读/写时间为10ns,主存的读/写时间为100ns,取指的命中率为98%,数据的命中率为95%,在执行程序时,约有1/5指令需要存/取一个操作数,为简化起见,假设指令流水线在任何时候都不阻塞;问设置cache后,与无cache比较,计算机的运算速度可提高多少倍答:1有cache的情况:平均访存时间=平均取指时间+平均取数时间=98%10ns+1-98%10ns+100ns+95%10ns+1-95%10ns+100ns/5=12ns+3ns=15ns2无cache的情况平均访存时间=平均取指时间+平均取数时间=1001+1001/5=120ns3速度提高倍数=120ns/15ns=8倍设某计算机的cache采用4路组相联映像,已知cache容量为16KB,主存容量为2MB,每个字块有8个字,每个字有32位;请回答:1 主存地址多少位按字节编址,各字段如何划分各需多少位2 设cache起始为空,CPU从主存单元0,1,…,100;依次读出101个字主存一次读出一个字,并重复按此次序数读11次,问命中率为多少若cache速度是主存的5倍,问采用cache与无cache比较速度提高多少倍答:1主存地址位数:2MB=221B,即21位;块内地址b:每个字块8个字,即3位,每个字32位即4个字节,需2位地址; 块号r:每组4路,需2位地址;组号c’:cache分成的组数为:16MB/4832/8B=27;即需要7位组号;区号t:t+r为2MB/16KB/4=29,即9位,故t=9-2=7位;2第一轮全部不命中,以后10次全部命中,命中率=10/11=91%设cache的读出时间为1,主存的读数时间为5,则:速度可提高到:无cache时的访问时间/有cache时的访问时间=115/101+15=倍设某计算机采用直接映像cache,已知容量为4096字;1 若CPU依次从主存单元0,1,…,99和4096,4097,…,4195交替取指令,循环执行10次,问命中率为多少2 如cache存取时间为10ns,主存存取时间为100ns,cache命中率为95%,求平均存取时间;答:1cache容量为4096字,其地址从0~4095,采用直接映像,则主存地址0和4096、1和4097、…、99和4195映射到cache的同一地址上;若从主存单元0~99和4096~4195交替取指令,因为cache内容的替换,所以命中率为0;2平均存取时间=10ns+1-95%100ns=15ns一个组相联cache,由64个存储块组成,每组包含4个存储块,主存由8192个存储块组成,每块由32字组成,访存地址为字地址;问:1主存和cache地址各多少位地址映像是几路组相联2在主存地址格式中,区号、组号、块号、块内地址各多少位答:1 主存单元数为819232=218,主存地址为18位;cache单元数为6432=211,cache地址为11位;因每组包含4个块,所以是4路组相联2 主存地址:每块32字,即块内地址b=5位;4路组相联,即块号r=2位;组数为64/4=16,即组号c=4位;主存块数/cache组数=8192/16=29,即t+r=9,所以区号t=7;主存储器容量为4MB,虚存容量为1GB1×109B,虚拟地址和物理地址各为多少位根据寻址方式计算出来的有效地址是虚拟地址还是物理地址如果页面大小为4kB,页表长度是多少答:4MB=222B,1GB=230B,所以虚拟地址30位,物理地址22位;根据寻址方式计算出来的有效地址是虚拟地址;如果页面大小为4KB,采用页式管理时,页面的数量=1GB/4KB=218,即页表长度为218;设磁盘组有11个盘片,每片有两个记录面;存储区域内直径英寸,外直径英寸;道密度为1250TPI,内层位密度52400bpi,转速为2400rpm;问:TPI表示每英寸磁道数,bpi表示每英寸位数(1)共有多少个存储面可用112-2=20存储面;最外两个面不可用;2 共有多少柱面柱面数=道数=12505-/2=16503 每道存储多少字节盘组总存储容量是多少每道存储量=2πr位密度=π52400=总存储容量=20面存储量=20道数道存储量=201650=4 数据传输率是多少数据传输率=道存储量转速=2400/60=s5 每扇区存储2KB数据,在寻址命令中如何表示磁盘地址磁盘地址由盘面号、道号和扇区号组成;20个盘面号由5位表示即可;1650个道号需用11位;每道扇区数=2KB≈24个扇区,用5位表示;设高密软盘,每面80个磁道,每磁道15扇区,每扇区存储512B;已知磁盘的转速为360rpm,今在一个磁道上写入4096B数据,平均需要多少时间最长时间是多少假设找道时间为10ms-40ms;解:写入平均时间=平均找道时间+平均等待时间+传输数据时间=10+40/2 ms+60/3602+60/3604096/512/15=25ms+83ms+89ms=197ms最长时间=40ms+60/360 s+89ms=296ms一磁带机有9个磁道8个磁道存储数据,1个磁道存储奇偶校验位,带长700m,带速2m/s,每个数据块1KB,块间间隔14mm;若数据传输率为128KB/s,试求:1 记录位密度;带速2m/s,传输率128KB/s,即2m的磁带含有128KB的容量,故磁带位密度=128KB/2m=64B/mm,一个磁带的位密度=64B/mm/8=64b/mm2 若带首尾各空2m,求此带最大有效存储容量;有效存储长度=700-22=696m每个数据块长度=数据长度+块间隔=1KB/64B/mm+14mm=16mm+14mm=30mm 磁带最大存储容量=块数每块容量=696m/30mm1KB=。
计算机组成原理第8、9、10章ppt课件
2003-5-15 .
5
寄存器组织举例
2003-5-15 .
6
CPU组成(con’t)
• 总线接口
– MAR、MDR – 取指
• PC->MAR • MEM->MDR->IR
– 读操作数
• EA->MAR • MEM ->MDR->REG
– 写结果
• EA->MAR • REG ->MDR->MEM
– 中断周期
• 保存PC至MEM中的堆栈等
• 参见8.2.2和9.1
2003-5-15 .
12
取指周期
• 根据PC从MEM中 取指令
– PC->MAR
– CU向MEM发读令, 1->R
– 得到指令字, M(MAR)-> MDR
– 指令字写入指令字 寄存器,MDR->IR
– CU控制形成下一条 指令的地址, PC+1->PC
– ACC0*Ad(IR)+/ACC0* (PC)->PC
2003-5-15 .
17
中断周期
• CPU在中断周期检查是否有中断发生
• 数据通路连接方式
– 分散式 – 总线式
CLK
CU
PC
IR
REG
MAR
MDR
MEM
地址总线 数据总线
2003-5-15 .
7
指令周期
• 执行一条指令所需的时间
– 通常,不同指令所需时间不同(如乘法操作的执行周期较长) – 单周期实现
• 定长单周期:一个周期一条指令,周期宽度以数据通路最长的指令 为准
计算机组原理英文缩写解译
计算机组成原理缩写词汇总第1章计算机系统概论1、ENIAC(Electronic Numerical Integrator And Computer)电子数值积分计算机(说明:第1台电子数字计算机)2、EDV AC(Electronic Discrete Variable Automatic Computer)电子离散变量自动计算机3、CPU(Central Processing Unit)中央处理器4、ALU (Arithmetic Logic Unit )算术逻辑单元5、CU(Control Unit)控制单元6、ACC(Accumulator)运算器的累加器7、MQ(Multiplier-Quotient Register)运算器的乘商寄存器8、MAR(Memory Address Register)存储器地址寄存器9、MDR (Memory Data Register)存储器数据寄存器10、PC(Program Counter)程序计数器11、IR(Instruction Register) 指令寄存器12、MIPS(Million Instruction Per Second)百万条指令每秒(说明:运算速度指标)13、CPI(Cycle Per Second)执行一条指令所需的时钟周期(说明:运算速度指标)14、FLOPS(Floating Point Per Second)浮点运算每秒15、MBPS(Million Bytes Per Second)兆字节每秒MbPS(Million Bits Per Second)兆位每秒第2章计算机的发展与应用1、SSI(Small Scale integration)小规模集成电路2、MSI(Medium Scale integration)中等规模集成电路3、LSI(Large Scale Integration)大规模集成电路4、VLSI(Very Large Scale Integration)超大规模集成电路5、CAD (Computer Aided Design)计算机辅助设计6、CAM (Computer Aided Manufacturing)计算机辅助制造7、CIMS(Computer Integrated Manufacturing Systems)计算机集成制造系统第3章系统总线1、M总线:存储总线2、I/O总线:输入/输出总线3、DMA(Direct Memory Access)直接存储器存取4、ISA总线(Industry Standard Architecture)工业标准结构总线5、EISA总线(Extended Industry Standard Architecture)扩展工业标准结构总线6、VESA总线(Video Electronic Standard Association)视频电子标准协会,又称VL局部总线7、PCI总线(Peripheral Component Interconnect)外围部件互联,是一种常用的局部总线8、AGP (Accelerated Graphics Port)加速图形端口9、USB总线(Universal Serial Bus) 通用串行总线10、BS(Bus Busy)总线忙11、BR(Bus Request)总线请求12、BG(Bus Grant)总线同意13、CB(Control Bus)控制总线14、DB(Data Bus)数据总线15、AB(Address Bus)地址总线第4章存储器1、TTL(Transistor Transistor Logic)晶体管-晶体管逻辑(也是一种电平标准)2、MOS(Metal Oxide-semiconductor)金属氧化物半导体,MOS管:也叫场效应管3、RAM(random access memory)随机存取存储器4、ROM(read only memory)只读存储器5、MROM (Masked ROM)掩模型只读存储器6、PROM (Programmable ROM)可编程只读存储器7、EPROM (Erasable Programmable ROM)可擦除可编程只读存储器8、EEPROM (Electrically Programmable ROM)用电可擦除可编程只读存储器9、Flash Memory 闪速存储器10、DRAM (Dynamic RAM)动态RAM11、SRAM (Static RAM)静态RAM12、MAT (Memory Access Time) 存取时间(反映主存速度的指标)13、MCT (Memory Cycle Time)存取周期(反映主存速度的指标)14、RAS(Row Address Select)行地址选通15、CAS(Column Address Select) 列地址选通16、CS(Chip Select)片选信号(低电平有效)17、WE(Write Enable)写允许信号(低电平为写,高电平为读)18、OE((Out Enable)允许读19、RD 允许读20、CE (Chip Select)芯片使能信号21、V CC 代表电源22、GND(ground) 代表接地端23、MREQ(Memory Request)访存控制信号24、PD/progr 功率下降/编程输入端(读出时为低电平,在只读存储器中应用)25、SDRAM (Synchronous DRAM) 同步动态RAM26、FIFO(First In First Out)算法(Cache的替换算法)27、LRU(Least Recently Used)算法(Cache的替换算法)28、tpi/tpm 道密度单位(磁表面存储器记录密度)29、bpi/bpm 位密度(线密度)单位(磁表面存储器记录密度)第5章输入输出系统1、DMA(Direct Memory Access)直接存储器存取2、CCW(Channel Control Word)通道指令(通道控制字)3、DBR(Data Buffer Register)数据缓冲寄存器4、CRT(Cathode-Ray Tube 阴极射线管)阴极射线管显示器5、LCD(Liquid Crystal Display)液晶显示器6、PD(Plasma Display)等离子显示器7、VRAM(Video RAM)视频存储器(刷新存储器)8、VGA/SVGA/XGA等Video Graphics Array 视频图形阵列,显示器显示标准9、INTR 中断请求信号(中断请求触发器)10、MASK 中断屏蔽触发器11、AR 主存地址寄存器12、WC 字计数器13、BR 数据缓冲寄存器14、DAR 设备地址寄存器15、DREQ 向DMA接口提出申请16、HRQ 发出总线使用权的请求信号(说明:11~16均为DMA控制器内部构成和相关信号)第6章计算机的运算方法CP (Clock Pulse)时钟脉冲第7章指令系统1、RISC(Reduced Instruction Set Computer)精简指令系统计算机2、CISC (Complex Instruction Set Computer)复杂指令系统计算机3、NOP 空操作指令4、HLT 停机指令5、RET (Return)子程序返回6、IRET (Interrupt Return)中断返回7、SP (Stack Point)堆栈指针8、EA (Effect Address)有效地址(存储器)9、OP (Operation Code) 操作码第8章CPU的结构和功能1、SPL(Super Pipe Lining)超级流水线第9章控制单元的功能第10章控制单元的设计1、CLK 时钟脉冲(机器主频)2、LDA (Load Accumulator)取数指令,此处的A指累加器3、STA (Load Accumulator)存数指令,此处的A指累加器4、CMDR 微程序控制器的MDR5、CMAR 微程序控制器的MAR6、CM(Control Memory)控制存储器,简称控存7、BIOS (Basic Input Output System)基本输入输出系统。
计算机组成原理课件(第10章__微机计算机基本工作原理
微型计算机功能的扩展
归根到底,计算机的功能在很大程度上取决于其中 央处理器部分,而后者的功能又取决于其控制器 的功能。此外,其它基本组成电路,如算术逻辑 部件( ALU )、寄存器的个数等等,都必须作相 应的改进,才能扩展计算机的功能。使之接近于 现代微型计算机。 这个功能更大的微型计算机,在硬件上增加不多, 而是算术逻辑部件及控制器的功能有相当的扩展。 这样,就既可能进行逻辑运算,也有跳转和循环 运算的功能
10.4
执行指令的例行程序
在程序和数据装入之后,启动按钮 将起动信号传给控制部件 CON,然后控 制部件产生控制字,以便取出和执行每 条指令。 执行一条指令的时间为一个机器周期。 机器周期又可分为取指周期和执行周期。 取指过程和执行过程机器都得通过不同 的机器节拍。在这些节拍内,每个寄存 器( PC 、 MAR 、 IR 、 A 、 B 、 O 等)的 内容可能发生变化。
10.2
指令系统
指令系统就是用来编制计算程 序的一个指令集合。在未编制出计 算程序之前,计算机是一堆无价值 的电路硬件。 这台微型机有五条指令,即其 控制部件能完成一系列例行程序以 执行五种命令: LDA—将数据装入累加器A ADD—进行加法运算
10.3
程序设计
这几个参与运算的数当然可以是任意的,所以 公式是用代数符号写的。这里所用的代数符号,故 意与存储单元的序列相一致。事实也是如此,因为 要参与运算的数必须先输入到存储器中去。 既然上面讲的微型计算机并不认识助记符的意 义,因此必须将指令清单中每一条指令都翻译成二 进制码──机器码。另外,存储器中既要写入计算程 序,也要存放参与运算的数据,那么,还得决定存 储器中的存储单元应如何分配 — 称为存储空间分配。 总之,程序设计中得包括:编制汇编语言写的 源程序、助记符的翻译、存储器的分配等几部分。 下面介绍一下程序设计步骤。
计算机组成原理第九、十章答案
ZB
Bo,Yi Co,ALUi,+ Zo,Bi
(2) SUB A,H指令流程及微命令序列如下:
PCMAR
PCo,MARi
MM读
1 R
PC+1 PC
MDR IR
+1(图中未标出,
可与前一步并行)
MDRo,IRi
OP=?
SUB
SUB HY
(AC)–(H)Z
ZAC
Ho,Yi
由于题意中没有给出确切的数据通路结构,
故上述节拍分配方案的并行性较低。
2. 写出完成下列指令的微操作及节拍安 排(包括取指操作)。
(1)指令ADD R1,X完成将R1寄存 器的内容和主存X单元的内容相加,结果存 于R1的操作。
(2)指令ISZ X完成将主存X单元的内 容增1,并根据其结果若为0,则跳过下一条 指令执行。
4. 能不能说机器的主频越快,机器 的速度就越快,为什么?
解:不能说机器的主频越快,机器
的速度就越快。因为机器的速度不仅与主 频有关,还与数据通路结构、时序分配方 案、ALU运算能力、指令功能强弱等多 种因素有关,要看综合效果。
5. 设机器A的主频为8MHz,机器周 期含4个时钟周期,且该机的平均指令执 行速度是0.4MIPS,试求该机的平均指令
K K+1
JMP I K 间址特征
解:假设同上题,仍按组合逻辑、单总
线、同步控制安排,带返转指令的全部微操 作及节拍如下:
取指周期: T0 PCMAR,1R T1 PC+1,M(MAR)MDR T2 MDRIR,OP(IR)ID 执行周期:
T0 K(IR)MAR T1 M+1MDR,0 -w
计算机组成原理第09章.
MARi MDRO
CPU 内 部 总 线
Y
ALU Z
(3) ADD @ X 执行周期 时钟
• MDR
MDRO
MAR
MARi
地址线
•1 R
• 数据线
• MDR
MDRO
MDR
Y ALU
Yi
地址线 数据线
• AC
ACO
ALU
ALUi
•(AC)+(Y) Z
•Z
ZO
2021/5/31
AC
ACi
控制信号
…
控制信号
入 X1 X2
RST7.5 7 34 IO/M
RST6.5 8 RST5.5 9
33 S1 32 RD
INTR 10 31 WR
出 CLK ALE S0 S1 IO/M RD WR
(3) 存储器和 I/O 初始化
入 HOLD Ready 出 HLDA
2021/5/31
INTA 11 30 ALE
AD0 12 29 S0 AD1 13 28 A15 AD2 14 27 A14 AD3 15 26 A13 AD4 16 25 A12 AD5 17 24 A11 AD6 18 23 A10 AD7 19 22 A9 Vss 20 21 A8
(1) CPU 内的各种控制信号
Ri Rj (PC) + 1 PC ALU +、-、与、或 ……
(2) 送至控制总线的信号
MREQ IO/M
访存控制信号
访 IO/ 存储器的控制信号
RD
读命令
WR
写命令
INTA
中断响应信号
2021/5/31
HLDA
总线响应信号
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计 算 机 组 成 原 理
10.1 10.2 10.3 10.4 10.5
高性能处理机体系结构的演变 安腾体系结构的基本设计思想 安腾指令系统结构 指令级并行机制 双核安腾处理机的组成
10章
安 腾 高 性 能 处 理 机
本章小结
6.1 单机系统的总线结构 10.1 高性能处理机体系结构的演变
10章
安 腾 高 性 能 处 理 机
10.2 安腾体系结构的基本设计思想
计 算 机 组 成 原 理
安腾体系结构脱离了IA32 CISC体系结构的束缚, 但并没有完全照搬RISC处理机的设计思想。 EPIC既不是RISC,也不是CISC,而是一种吸收了 CISC 和 RISC 两者长处的全新的体系结构。 主要体现在以下几个方面:
通过将多条指令放入一个超长指令字,能有效提高处理机内 各个执行部件的利用率。
安 算 机 组 成 原 理
then else ”分支结构转变为无分 支的顺序/并行代码,以避免由于错误预测分支而付出代价。
(技术能将传统的“ if
10章
当处理机在运行中遇到分支时,它并不是进行传统的分支预 测并选择可能性最大的一个分支执行,而是按分支的所有可能的 后续路径开始并行执行多段代码并暂存各段代码的执行结果,直 到处理机能够确认分支转移与否的条件是真是假时,处理机再把 应该选择的路径上的指令执行结果保留下来。
6、寄存器堆栈技术
10章
安 腾 高 性 能 处 理 机
安腾处理机利用128个通用寄存器中的96个堆栈寄存器实现寄存器堆 栈。并在处理机内部设置一个寄存器堆栈引擎RSE来管理寄存器堆栈。 当96个堆栈寄存器不够用时,寄存器堆栈引擎能够自动将寄存器堆 栈与内存储器对接,将寄存器堆栈溢出的数据转移到内存储器中保存, 或在寄存器堆栈弹出数据时执行反向操作。这样,编译器将看到一个容 量没有限制的寄存器堆栈空间。
10章
M单元:存储器执行单元
安 腾 高 性 能 处 理 机
B单元:转移执行单元 F单元:浮点执行单元
相应地,安腾指令系统中的所有指令被分成六种类型
二、安腾寄存器结构
计 算 机 组 成 原 理
与RISC体系结构类似,安腾 体系结构大量使用寄存器操作
10章
只有取数load和存数store 指令才能够访问内存,所 有其他指令都在寄存器上 操作。 用户可直接使用的寄存器 数量甚至大大超过了主流 RISC处理机
安 腾 高 性 能 处 理 机
4、推测技术:
计 算 机 组 成 原 理
包括控制推测和数据推测,以减少存储器访问响应时间的影响。
控制推测技术和数据推测技术允许提前执行从内存单元至通用寄 存器的取数指令。当程序中有分支时:
控制推测技术将位于分支指令之后的取数指令提前若干周期执行, 以此消除访存延时,提高指令执行的并行度。 数据推测技术则用于解决提前取数指令后的数据相关性问题。
2.超长指令字(VLIW)技术
计 算 机 组 成 原 理
超长指令字(VLIW)技术是提高计算机系统并行性的有效手段。 VLIW系统中指令字长可多达几百位,编译器经过优化,能将多条 能够并行执行的指令合并成一个具有多个操作码的超长指令字, 控制多个独立的功能部件工作。
10章
EPIC是基于超长指令字的设计
10章
安 腾 高 性 能 处 理 机
显式并行指令计算(EPIC)技术 超长指令字(VLIW)技术 分支推断技术 推测技术 软件流水技术 寄存器堆栈技术
计 算 机 组 成 原 理
1.显式并行指令计算(EPIC) 技术总线的特性: 安腾的指令中设计了属性字段,用于指明哪些指令可以并行 执行。这些属性信息并不是在指令执行过程中由处理机判定后获 得的,而是由编译程序在编译时通过对源代码的分析获取指令级 的并行性信息,并填写到执行代码中。
10.3安腾指令系统结构
计 算 机 组 成 原 理
一、执行单元与指令类型
为提高并行处理能力,安腾处理机内部设置了多个执行单元。 这些执行单元被分为四类: 用于执行整数算术运算、逻辑运算、 移位和比特处理等指令,以及32位数据 I单元: 整数执行单元 和指针操作。 用于执行通用寄存器、浮点寄存器 和存储器之间的取数指令、存数指令以 及某些整数ALU运算指令。 用于执行转移分支类指令。 用于执行浮点运算指令。
采用了推断技术后,原有的转移指令被转换成条件执行指令。原 有的转移指令的所有的分支都被并行执行,无论哪条分支将被命中, 都不会出现流水线断流现象,故消除了因分支预测失误而重新装载流 水线导致的低效率现象。 更进一步,以前由于程序分支和指令依赖等因素不能并行执行的 许多指令现在完全可以并行执行,从而提高了处理机的执行效率。
计 算 机 组 成 原 理
一、IA体系结构的历史演变 IA32体系结构:IA32家族中的第一款32位微处理机流 水技术 IA32体系结构仍是基于CISC架构的处理机。 Pentium 体系结构:CISC外壳加RISC内核的结构 二、英特尔64位处理机的两种体系结构 1、64T(英特尔64):基于显式并行指令计算EPIC技 术的IA64体系结构,不与IA64指令系统的兼容性。 2、安腾体系结构:与IA64指令系统的兼容性。
10章
安 腾 高 性 能 处 理 机
推测技术避免了cache命中失败而导致访存延迟的损失,消除了 因处理机空闲而导致的并行性降低的缺憾。
5、软件流水技术
计 算 机 组 成 原 理
安腾体系结构引入了新机制来支持软件流水,包括自动寄存器 重命名、推断执行和特殊的循环终止指令。因此,安腾处理机能够 通过旋转寄存器机制为每个循环步提供自己的寄存器。 安腾体系结构中硬件对编译器管理软件流水线的支持使得编译 器能够生成精简的代码,以高度并行的方式实现循环操作。
这就是所谓显式并行的概念。
10章
安 腾 高 性 能 处 理 机
EPIC 技术则充分利用现代编译程序强大的对程序执行过程的 调度能力,由专用的 EPIC 编译器首先分析源代码,根据指令之间 的依赖关系最大限度地挖掘指令级的并行性,从而确定哪些指令可 以并行执行,然后把并行指令放在一起并重新排序,提取并调度其 指令级的并行,并将这种并行性通过属性字段“显式”地告知指令 执行部件。