计算机系统结构期末复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
计算机系统结构定义
计算机=软件+硬件(+网络)
两种定义:
定义1:Amdahl于1964年在推出IBM360系列计算机时提出:程序员所看到的计算机系统的属性,即概念性结构和功能特性
定义2:
计算机系统结构主要研究软硬件功能分配和对软硬件界面的确定
计算机系统的多级层次模型
第6级专用应用语言机器特定应用用户(使用特定应用语言)
(经应用程序翻译成高级语言)
第5级通用高级语言机器高级语言程序员(使用通用高级语言)
(经编译程序翻译成汇编语言)
第4级汇编语言机器汇编语言程序员(使用汇编语言)
(经汇编程序翻译成机器语言、操作系统原语)
第3级操作系统语言机器操作系统用户(使用操作系统原语)
(经原语解释子程序翻译成机器语言)
第2级传统机器语言机器传统机器程序员(使用二进制机器语言)
(由微程序解释成微指令序列)
第1级微指令语言机器微指令程序员(使用微指令语言)
(由硬件译码器解释成控制信号序列)
第0级硬联逻辑硬件设计员
第0级由硬件实现,第1级由微程序实现,第2级至第6级由软件实现,由软件实现的机器称为:虚拟机
从学科领域来划分:第0和第1级属于计算机组织与结构,第3至第5级是系统软件,第6级是应用软件。它们之间仍有交叉。第0级要求一定的数字逻辑基础;第2级涉及汇编语言程序设计的内容;第3级与计算机系统结构密切相关。在特殊的计算机系统中,有些级别可能不存在。
计算机组成:是计算机系统结构的逻辑实现
确定数据通路的宽度
•确定各种操作对功能部件的共享程度
•确定专用的功能部件
•确定功能部件的并行度
•设计缓冲和排队策略
•设计控制机构
•确定采用何种可靠性技术
计算机实现:是指计算机组成的物理实现
处理机、主存储器等部件的物理结构
•器件的集成度和速度
•专用器件的设计
•器件、模块、插件、底版的划分与连接
•信号传输技术
•电源、冷却及装配技术,相关制造工艺及技术等
计算机系统结构、计算机组成和计算机实现是三个不同的概念。系统结构是计算机系统的软硬件的界面;计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。他们各自包含不同的内容,但又有紧密的联系。组成和实现的改进推动系统结构的进步。
Amdahl定律:(定量原理)系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占执行时间的比例有关。
加速比公式:Sn=T0/Tn=1/((1-Fe)+Fe/Se) (应该大于1)
加速比受Fe的限制,它越大就越有可能获得更大加速比
例子:书10页例1.1 和1.2
CPU性能公式:Te=IC*CPI*CYCLE;
例子:11页例1.3
计算机系统结构的分类方法:Flynn分类(按照指令流和数据流的多倍性特征对计算机系统进行分类)冯氏分类(用
最大并行度来对计算机系统进行分类)、Handler分类
计算机系统设计的主要方法:由下往上、由上往下、由中间开始设计
计算机系统结构评价标准
MIPS=指令条数/(指令执行时间*10^6)=Fz/CPI=Fz*IPC
IPC为每个时钟周期平均执行的指令条数
例1:计算PentiumII 450处理机的运算速度。
解:由于PentiumII 450处理机的IPC=2(或CPI=0.5),Fz=450MHz
MIPS=FZ*IPC=2*450=900MIPS
等效指令速度MIPS
等效CPI
Wi:指令使用频度。通常:加、减法50%,乘法15%,除法5%,程序控制15%,其它15%
例2:我国最早研制的小型计算机DJS-130,定点16位,加法速度每秒50万次,但没有硬件乘法和除法等指令。用软件实现乘法和除法,速度降低100倍左右,求定点等效速度。
解:MIPS=1/((0.8/0.5)+(0.2/0.005))=0.02MIPS
即每秒2万次,由于乘法和除法用软件实现,等效速度降低了25倍。
例3 如果浮点开平方操作FPSQR的比例为2%,它的CPI为100,其他浮点操作的比例为23%,它的CPI=4.0,其余指令的CPI=1.33,计算该处理机的等效CPI。如果FPSQR操作的CPI也为4.0,重新计算等效CPI。
解:•等效CPI1=100 ×2%+4 ×23%+1.33 ×75%=3.92
等效CPI2=4 ×25%+1.33 ×75%=2.00
由于改进了仅占2%的FPSQR操作的CPI,使等效速度提高了近一倍
第二章
数据表示+数据结构=数据类型
操作码的优化表示:定长编码、HUFFMAN编码、扩展编码(***课后题****)
复杂指令系统计算机CISC:增强指令功能,设置功能复杂的指令;面向目标代码、面向高级语言、面向操作系统;用一条指令代替一串指令
RISC精简指令系统计算机:简化指令功能,只保留功能简单的指令;较复杂的功能用子程序来实现
较复杂的功能用子程序来实现
RISC的思想精华:减少指令平均执行周期数(CPI)
RISC的特点(1) 简单而统一格式的指令译码。(2) 大部分指令可以单周期执行完成。(3) 只有LOAD和STORE指令可以访问存储器。(4) 简单的寻址方式。 (5) 采用延迟转移技术。(6) 采用LOAD延迟技术。
RISC的关键技术
1、延时转移技术(名词)
定义:为了使指令流水线不断流,在转移指令之后插入一条有效的指令,而转移指令被延迟执行,这种技术称为延迟转移技术。
采用指令延迟转移技术时,指令序列的调整由编译器自动进行。
采用延迟转移技术的两个限制条件
(1)被移动指令在移动过程中所经过的指令之间不能有数据相关
(2)被移动的指令不破坏条件码,至少不影响后面的指令使用条件码
如果找不到符号条件的指令,必须在条件转移指令后面插入空操作
如果指令的执行过程分为多个流水段,则要插入多条指令
2、指令取消技术
原因:采用指令延时技术,在许多情况下找不到可以用来调整的指令
向后转移(循环程序)
实现方法:循环体的第一条指令经调整后安排在两个位置,第一个位置是在循环体的前面,第二个位置安排在循环体的后面,
如果转移成功,则执行循环体后面的指令,然后返回到循环体开始;否则,则取消循环体后面的指令,继续执行后面的指令
3、重叠寄存器窗口技术(Overlapping Register Window)