计算机系统结构2
计算机系统结构课后答案unit2
![计算机系统结构课后答案unit2](https://img.taocdn.com/s3/m/deb491c16bec0975f565e24e.png)
第2章数据表示与指令系统1、数据结构和机器的数据表示之间是什么关系确定和引入数据表示的基本原则是什么?答:数据表示是能由硬件直接识别和引用的数据类型。
数据结构反映各种数据元素或信息单元之间的结构关系。
数据结构要通过软件映象变换成机器所具有的各种数据表示实现,所以数据表示是数据结构的组成元素。
不同的数据表示可为数据结构的实现提供不同的支持,表现在实现效率和方便性不同。
数据表示和数据结构是软件、硬件的交界面。
除基本数据表示不可少外,高级数据表示的引入遵循以下原则:(1)看系统的效率有否提高,是否养活了实现时间和存储空间。
(2)看引入这种数据表示后,其通用性和利用率是否高。
2、标志符数据表示与描述符数据表示有何区别描述符数据表示与向量数据表示对向量数据结构所提供的支持有什么不同?答:标志符数据表示指将数据类型与数据本身直接联系在一起,让机器中每个数所都带类型樗位。
其优点是:(1)简化了指令系统和程序设计;(2)简化了编译程序;(3)便于实现一致性校验;(4)能由硬件自动变换数据类型;(5)支持数据库系统的实现与数据类型无关;(6)为软件调试和应用软件开发提供支持。
缺点是:(1)会增加程序所点的主存空间;(2)在微观上对机器的性能(运算速度)不利。
数据描述符指数据的描述与数据分开存放,描述所访问的数据是整块还是单个的,及访问该数据块或数据元素的地址住处它具备标志符数据表示的优点,并减少了标志符数据表示所占的空间,为向量和数组结构的实现提供支持。
数据描述符方法优于标志符数据表示,数据的描述与数据分开,描述所访问的数据是整块还是单个的,及访问该数据块或数据元素的地址信息,减少了樗符数据表示所占的窨。
用描述符方法实现阵列数据的索引比用变址方法实现要方便,且便于检查出程序中的阵列越界错误。
但它不能解决向量和数组的高速运算问题。
而在有向量、数组数据表示的向量处理机上,硬件上设置有丰富的赂量或阵列运算指令,配有流水或阵列方式处理的高速运算器,不仅能快速形成向量、数组的元素地址,更重要的是便于实现把向量各元素成块预取到中央处理机,用一条向量、数组指令流水或同时对整个向量、数组高速处理.如让硬件越界判断与元素运算并行。
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
![计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录](https://img.taocdn.com/s3/m/52be344d360cba1aa911da6d.png)
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
计算机系统结构多媒体教程课件_第八章 数据流计算机结构2
![计算机系统结构多媒体教程课件_第八章 数据流计算机结构2](https://img.taocdn.com/s3/m/c0d1b51d14791711cc7917cb.png)
指令格式
在数据流计算机中,一条指令包含两部分: • 操作包(operation packet ) • 数据令牌(data token)
指令格式(cont.)
• 操作包(或指令包─instruction cell)通常由操作 码、源操作数、后继指令地址组成。 • 又可以看成是由操作型和受处理单元影响的部分两 者组成。操作型包括操作码、有关常数的指示及常 数值、目标操作地址、本操作要求几个数据令牌的 标志等信息,这些信息一旦设定后就不再改变。受 处理单元影响的部分包括已经接收到的操作数值、 数据令牌已到的标志、正在等待的数据令牌等信息 。 • 操作包在存储器中将占据一定大小的空间。
模式匹配驱动方式
计算的进行是由谓词模式匹配加以驱动的。 程序的执行主要受控于寻找谓词的匹配和度 量的归一操作,其中的谓词是代表客体之间 关系的一种字符串模式。 该驱动模式主要适合求解非数值的符号演算。 智能计算机就是基于该驱动模式。
数据流计算机的由来
冯· 诺依曼型计算机的基本特点是在程序计数器的 集中控制下顺序地执行指令,是以控制驱动方式工 作的。 为了设计高性能的计算机系统结构,其中一个方法 是突破冯· 诺依曼型的结构,采用数据驱动执行方 式而形成的数据流计算机。 美国MIT实验室的Jack Dennis 及其助手于1972年首 先提出了数据流模型,并证明由此而设计的数据流 计算机,其性能价格比高,较好的跟踪工艺技术进 步的速度,能较方便地在应用领域中进行可编程应 用。
计算机系统结构 -数据流计算机结构
四种驱动方式
为了提高计算机并行处理能力,可能突 破冯· 诺依曼型的结构,寻求有利于开发 高度并行功能的计算模型。 计算模型中不仅要考虑数据控制类型, 更要考虑驱动方式(即控制机制)。 控制驱动、数据驱动、需求驱动、模式 匹配驱动等四种驱动方式。
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
![计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录](https://img.taocdn.com/s3/m/52be344d360cba1aa911da6d.png)
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
计算机系统结构第2章
![计算机系统结构第2章](https://img.taocdn.com/s3/m/5a727bf9541810a6f524ccbff121dd36a32dc4de.png)
计算机系统结构第2章第⼆章指令系统第⼀节指令系统设计概述⼀、指令系统概述1、指令系统的设计、应⽤及实现(1)指令系统的设计*机器指令:计算机硬件实现的运算或操作的命令;第i 种格式:OP i A 1A 2编码⽰例:00110 000~111 000~111功能⽰例:A 1←(A 1)+(A 2)第j 种格式:OP j A 编码⽰例:10110 000~111功能⽰例:A←(A)+1*指令系统设计:定义所有机器指令的格式(含编码)。
*指令系统:所有机器指令的集合;第1种:第2种:…第n 种:OP 1A 1A 2OP 2A OP n A 1A 2…(2)指令系统的应⽤第i种指令应⽤⽰例a:00110 000 001 功能AH←(AH)+(AL)⽰例b:00110 011 000 功能BL←(BL)+(AH)应⽤程序⽰例:从主存地址为2000H开始的100个元素累加求和机器指令格式机器指令程序汇编程序1011wreg data 1011001001100100 CX←1001011100100000000 00100000LP:BX←2000H1011000000000000 AL←0 0000000w mod reg r/m 0000000100000111AL←AL+[BX] 01000reg 01000001 BX←BX+1 11100010 disp 11100010 11111000 LOOP LP*指令系统应⽤:按指令格式要求,根据应⽤需要、编写程序中的指令(即指令格式的实例)。
(3)指令系统的实现指令功能实现步骤—ID 对IR 的OP 译码,⽤输出信号控制某⼀部件⼯作;ID 对IR 的A 译码,⽤输出信号控制相关REG 的读/写;信号有效时间由时序部件及该指令功能实现步骤决定。
指令操作或运算—部件功能实现及数据传递等的组合。
*指令系统实现:按指令格式要求,⽤硬件实现指令功能。
*设计/应⽤实现三者关系:类似C 语⾔设计、⽤C 语⾔编程、C 语⾔编译及执⾏平台!☆指令系统的实质—软件与硬件之间的界⾯(“约定”)!指令译码器ID I OP A 内部总线CPU ID D 功能部件1功能部件n …寄存器1寄存器m…指令寄存器IR :……存储总线MAR/MDR2、指令系统涉及内容(1)指令格式包含信息分析第i种指令格式:OP i A1A2②数据:(A1)=OP i⽀持类型的地址为A1的数据①操作:A1←(A1) OP i(A2) 或A 2←(A2) OP i(A1)硬件⽀持的数据类型(含数据长度)可存放数据部件类型、部件的编址⽅式部件中同⼀数据地址的表⽰⽅式(2)涉及内容*指令集结构:指令集总体框架,如存放部件、寄存器数量;*指令集功能:⽀持操作的类型;*数据表⽰:操作⽀持的数据类型、数据存储格式等。
13计算机系统结构2-2
![13计算机系统结构2-2](https://img.taocdn.com/s3/m/a51695f00242a8956bece440.png)
用转移目标缓冲栈(BTB)的转移预测 使用转移目标缓冲栈作为转移预测策略。把BHT中 转移指令字段改为转移指令地址 BTB格式 [转移指令地址 ,历史表信息,转移目标指令地址] 一般在译码分析阶段得到转移指令地址
使用转移目标指令缓冲栈(BTIB) 转移指令在指令分析部件中译码时,转移不 成功方向的指令已被预取到指令缓冲栈中, 或者已经存放在I-cache中。 在转移成功方向上也预取一部分指令,把 BTB中的“转移目标地址”改为存放转移目 标地址之后的n条指令。这种预测称为转移 目标指令缓冲栈BTIB。
静态转移预测技术
遇条件转移时,用“猜测法”选择一个分支方向。 选择“转移不成功”方向。控制逻辑简单。 “猜测”不正确,已执行多个流水段将浪费。
静态分支技术
2 提前形成条件码,生成转移目标地址 条件转移指令BRANCH通常要在ME形成条件 转移地址。多数情况下,可以提前判别转移是 否发生或形成条件转移代码。 一些运算型条件转移指令,在实际运算前 (ID)或运算中间(EX)就能产生条件码。不必 等运算结束。 把计算转移目标地址操作移到ID段完成.
流水线控制相关
流水线中条件转移类执行时,有两种结果: 1.发生转移,将程序计数器PC内容改成转移 目标地址; 2.不发生转移,PC指向下一条指令地址。 条件转移指令往往要在流水线末端时转移条 件才能建立。流水线性能会大幅度下降。 从相关角度看,条件转移指令或中断指令与 后续指令存在着一种控制上的全局相关。
则
控制相关的解决方法
静态分支技术 静态转移预测技术(猜测法) 提前形成条件码,生成转移目标地址 延迟转移 改进循环程序 硬件上计算两个PC值(转移成功或失败)。 动态分支预测技术 1. “转移历史表”BHT。 2. “转移目标缓冲栈”(BTB) 3. 转移目标指令缓冲栈BTIB。
计算机系统结构(第2版(课后习题答案
![计算机系统结构(第2版(课后习题答案](https://img.taocdn.com/s3/m/244b099f2e3f5727a4e96255.png)
word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。
第2章计算机系统结构PPT课件
![第2章计算机系统结构PPT课件](https://img.taocdn.com/s3/m/6fa6cdffa8956bec0875e318.png)
(2)I/O中断
中央处理器按程序规定的顺序执行指令,当中央处理器执 行到一条“启动外设(启动I/O)”指令时,就按指令中给定的 参数启动指定的设备,并把设备的控制权交给输入输出控制系 统。由输入/输出控制系统控制外围设备与主存储器之间的信息 传送,外围设备独立工作,不再需要中央处理器的干预,于是 中央处理器可以继续执行其他程序。(中央处理器和外设便可 以并行工作)
2.2.1 计算机系统的硬件环境之并行工作
1、CPU与外设并行工作的I/O中断(P17) 在现代通用计算机系统中,输入/输出控制系统负责完成外围设备与
主存储器之间的信息传送。 (1)CPU与外设并行工作
各种外设连接到相应的设备控制器上,通过通道把设备控制器连接 到公共的系统总线上,这种结构允许CPU与外设并行工作。
这些寄存器都是处理器的工作寄存器,当处理器执行程序时, 每次从主存储器中读出一条指令,并把它存入“指令寄存器”中, 然后分析指令,根据指令中指定的地址,从主存储器读出操作数, 存入“通用寄存器”,根据指令中的操作码,对操作数进行运算, 并将所得的结果或暂存在通用寄存器中或存储到主存储器中,利用 控制寄存器来保证各程序交替占用处理器时能正确执行,保证系统 安全。
但由于外围设备是由中央处理器根据程序的要求而启动的, 故当外围设备工作结束后,应反馈该设备的工作情况,形成一 个“输入/输出操作结束的事件”,由中断完成,硬件识别该事 件后就急触发一个I/O中断,并暂停当前占用中央处理器的程序 的执行,让操作系统的处理程序来处理这个“输入/输出操作结 束”事件,操作系统进行分析后就可以知道该外围设备的工作 情况,从而确定启动该外围设备的程序的工作状态。
▪ 如果没有找到,就从主存中读取,同时把这个数据复制到高速 缓存中
计算机系统结构课件第2章
![计算机系统结构课件第2章](https://img.taocdn.com/s3/m/1e0613e59b89680203d825a4.png)
2.Huffman编码法 Huffman编码法是1952年由Huffman提出的一种可变字长编码 (VLC)。采用Huffman编码法表示操作码,必须先知道各种指令在 程序中出现的概率,这可通过对典型程序统计得到。根据 Huffman编码法的原理,操作码的最短长度可通过下式计算:
H pi log 2 pi
(3)主存寻址 主存寻址是所有计算机中都普遍采用的一类寻址方式,其寻 址种类也最为复杂。主存寻址的指令格式主要有: OPC M OPC M, M OPC M, M, M (4)堆栈寻址 堆栈寻址方式的地址是隐含的,在指令中不必给出操作数的 地址。因此,指令的长度很短,一般的形式有: OPC OPC M
i 1
n
Pi表示第i种操作码在程序中出现的概率,一共有n种操作码。 如果采用固定长操作码,n种操作码共需要个 log 2 n 二进制 位,因此固定长度操作码的信息冗余量为:
R 1
pi log 2 pi
i 1
n
log 2 n
3.扩展编码法 Huffman编码法能使操作码的平均长度最短,信息的冗余量 最小。然而,这种编码方法所形成得操作码很不规整。这不利于 硬件的译码,也不利于软件的编译,也很难与地址码配合,形成 有规则长度的指令编码。 在许多处理机中,采用了一种新的折中的方法,称为扩展编 码法。这种方法是由固定长操作码与Huffman编码法相结合形成 的。对于上节中有7条指令的模型机例子,如果采用扩展编码法编 排操作码,可有多种方法。
3.自定义数据表示 为了减少高级语言与机器语言之间的差别,采用了自定义数 据表示,就是由数据本身来表明数据类型,这样可以使每种指令 的种类大为减少,称为通用化指令。自定义数据表示有带标志符 数据表示和数据描述符表示。 (1)带标志符数据表示就是对每一个数据都附加一个标志符, 由这个标志符来表示这个数据的类型。这种表示法的优点是:简 化指令系统;易于对编程查错;自动类型转换;简单化编译;方 便程序调试。缺点是增加存储空间又使指令执行速度变慢。 (2)数据描述符表示,主要用来描述复杂和多维结构的数据 类型,如向量、记录等。它与带标志符数据表示不同之处是: ①标志符与每个数据相连,两者合存在一个存储单元中;而 描述符则和数据分开存放; ②要访问数据集中的元素时,先访问描述符,这至少增加一 级寻址; ③描述符看成是程序一部分,而不是数据的一部分。标志符 则可看作是数据的一部分。
计算机系统结构 第二章自考练习题答案
![计算机系统结构 第二章自考练习题答案](https://img.taocdn.com/s3/m/41110249a8114431b90dd874.png)
第二章数据表示与指令系统历年真题精选1. 计算机中优先使用的操作码编码方法是( C )。
A. BCD码B. ASCII码C. 扩展操作码D. 哈夫曼编码=16,除尾符之外的尾数机器位数为8位时,可表示的规格化最大尾2.浮点数尾数基值rm数值为( D )。
A. 1/2B. 15/16C. 1/256D. 255/2563. 自定义数据表示包括(标志符)数据表示和(数据描述符)两类。
4. 引入数据表示的两条基本原则是:一看系统的效率是否有提高;二看数据表示的(通用)性和(利用)率是否高。
5. 简述设计RISC的一般原则。
6. 简述程序的动态再定位的思想。
7. 浮点数表示,阶码用二进制表示,除阶符之外的阶码位数p=3,尾数基值用十进制表示,除尾符外的尾数二进制位数m=8,计算非负阶、规格化、正尾数时,(1)可表示的最小尾数值;(2)可表示的最大值;(3)可表示的尾数个数。
8. (1)要将浮点数尾数下溢处理成K—1位结果,则ROM表的单元数和字长各是多少并简述ROM表各单元所填的内容与其地址之间的规则。
(2)若3位数,其最低位为下溢处理前的附加位,现将其下溢处理成2位结果,设计使下溢处理平均误差接近于零的ROM表,以表明地址单元与其内容的关系。
同步强化练习一.单项选择题。
1. 程序员编写程序时使用的地址是( D )。
A.主存地址 B.有效地址 C.辅存实地址 D.逻辑地址2. 在尾数下溢处理方法中,平均误差最大的是( B )。
A.舍入法 B.截断法 C.恒置“1”法 D.ROM查表法3. 数据表示指的是( C )。
A .应用中要用到的数据元素之间的结构关系B .软件要处理的信息单元之间的结构关系C .机器硬件能识别和引用的数据类型D .高级语言中的数据类型说明语句4. 标志符数据表示中的标志建立由( A )。
A .编译程序完成B .操作系统完成C .高级语言编程时完成D .汇编语言编程时完成5. 堆栈型机器比通用型机器优越的是( C )。
计算机系统结构 第 2 章 指令集结构
![计算机系统结构 第 2 章 指令集结构](https://img.taocdn.com/s3/m/0cc19711c281e53a5802ff98.png)
2.1 指令系统结构的分类
• • • • • • 1. 指令系统分类的准则 ⑴ 在CPU中操作数的存放方法。 ⑵ 在每条指令中,显式指明的操作数个数。 ⑶ 操作数的寻址方式。 ⑷ 指令系统所提供的操作类型。 ⑸ 操作数的类型与大小。
2014-3-8
10
2.指令系统结构的分类
• • • • 按在CPU中操作数的存放方法可分为: ⑴ 堆栈型 ⑵ 累加器型 ⑶ 通用寄存器型
2014-3-8
21
4. 编址单位
• ⑴ 字编址:以访问一次设备所获得的信息量 为单位进行编址。 • ⑵ 字节编址:以字节为单位进行编址。 • ⑶ 位编址:按二进制位编址。
2014-3-8
22
按字节编址时需解决的问题
• ① 多字节数据的存放顺序 • 小端排序:将一个字中的低位字节存放在低地址 单元中。 • 大端排序:将一个字中的高位字节存放在低地址 单元中。 • 小端排序符合从右向左进位的硬件习惯;大端排 序符合程序员从左向右的编程习惯。
• 5. 按地址寻址方式(略,P47)
• 寻址方式的使用频度:
• R寻址->直接->变址->单字位移->自增->R间址->自减 • 高 -------------------------- 低
2014-3-8
26
2.2.2 按内容访问方式
• • • • • 1. 按内容访问方式 按照要访问的数据的内容访问内存。 2. 联想存储器(相联存储器、按内容访问存储器) 满足按内容访问方式的存储器。 联想存储器的主要特点:以并行方式在存储器中 查找所需信息的内容。 • 3. 按内容访问的方法 • 通过硬件将要访问的内容与存储单元的内容进行 比较,若相同,则进行访问。
计算机系统结构第二章(习题解答)
![计算机系统结构第二章(习题解答)](https://img.taocdn.com/s3/m/ee45f80911a6f524ccbff121dd36a32d7375c790.png)
计算机系统结构第⼆章(习题解答)1. 数据类型、数据表⽰和数据结构之间是什么关系?在设计⼀个计算机系统时,确定数据表⽰的原则主要有哪⼏个?答:略2. 假设有A 和B 两种不同类型的处理机,A 处理机中的数据不带标志位,其指令字长和数据字长均为32位。
B 处理机的数据带有标志位,每个数据的字长增加⾄36位,其中有4位是标志符,它的指令条数由最多256条减少⾄不到64条。
如果每执⾏⼀条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。
对于⼀个由1000条指令组成的程序,分别计算这个程序在A 处理机和B 处理机中所占⽤的存储空间⼤⼩(包括指令和数据),从中得到什么启发?答:我们可以计算出数据的总数量:∵程序有1000条指令组成,且每条指令平均要访问两个操作数∴程序访问的数据总数为:1000×2=2000个∵每个数据平均访问8次∴程序访问的不同数据个数为:2000÷8=250对于A 处理机,所⽤的存储空间的⼤⼩为:bit4000032250321000MemMemMemdataninstructio A=?+?=+=对于B 处理机,指令字长由32位变为了30位(条数由256减少到64),这样,所⽤的存储空间的⼤⼩为:bit3900036250301000MemMemMemdataninstructio B=?+?=+=由此我们可以看出,由于数据的平均访问次数要⼤于指令,所以,采⽤带标志符的数据表⽰不会增加总的存储空间⼤⼩。
3. 对于⼀个字长为64位的存储器,访问这个存储器的地址按字节编址。
假设存放在这个存储器中的数据中有20%是独⽴的字节数据(指与这个字节数据相邻的不是⼀个字节数据),有30%是独⽴的16位数据,有20%是独⽴的32位数据,另外30%是独⽴的64位数据;并且规定只能从⼀个存储字的起始位置开始存放数据。
⑴计算这种存储器的存储空间利⽤率。
⑵给出提⾼存储空间利⽤率的⽅法,画出新⽅法的逻辑框图,并计算这种⽅法的存储空间利⽤率。
计算机体系结构第2版课件第2章 第1讲
![计算机体系结构第2版课件第2章 第1讲](https://img.taocdn.com/s3/m/5e537073a5e9856a561260c5.png)
指令集与计算机的性能
TCPU CPI IC TCLK
源程序
指令集
指令译码
指令编码
优化编译器
目标代码
CPI和数据通路 复杂度
2. 指令集结构的分类
一般来说,可以从如下五个因素考虑对计算 机指令集结构进行分类,即:
在CPU中操作数的存储方法; 指令中显式表示的操作数个数; 操作数的寻址方式; 指令集所提供的操作类型; 操作数的类型和大小。
两种主要的指令特性能够将通用寄存器型指 令集结构(GPR)进一步细分。
ALU指令到底有两个或是三个操作数? 在ALU指令中,有多少个操作数可以用存储器
来寻址,也即有多少个存储器操作数?
通用寄存器型指令集结构的分类
ALU指令中 存储器操作 数的个数
0
ALU指令中 操作数的最多
个数
3
结构 类型
RR
机器实例
MIPS, SPARC, Alpha, PowerPC, ARM
1
2
RM
IBM 360/370, Intel 80x86, Motorola 6800
3
RM
IBM 360/370
2
2
MM
VAX
3
3
MM
VAX
通用寄存器型指令集结构的分类
可以将当前大多数通用寄存器型指令集结构 进一步细分为三种类型:
缺点:
由于有一个操作数的内容将被破坏,所以指令中的两个操 作数不对称。在一条指令中同时对寄存器操作数和存储器 操作数进行编码,有可能限制指令所能够表示的寄存器个 数。指令的执行时钟周期因操作数的来源(寄存器或存储 器)的不同而差别比较大。
计算机系统结构 第2章PPT课件
![计算机系统结构 第2章PPT课件](https://img.taocdn.com/s3/m/a4bfe2b0551810a6f4248609.png)
Mem[ ]:存储器的内容 Regs[ ]:寄存器的内容 Mem[Regs[R1]]:以寄存器R1中的内容作为地址的
存储器单元中的内容
▲
1155/75
寻址方式
寄存器寻址 立即值寻址 偏移寻址 寄存器间接寻址 索引寻址 直接寻址或 绝对寻址 存储器间接寻址 自增寻址
(产生了两类不同的计算机系统 ) ➢ CISC(复杂指令集计算机)
增强指令功能,把越来越多的功能交由硬件来实 现,并且指令的数量也是越来越多。
➢ RISC(精简指令集计算机)
尽可能地把指令集简化,不仅指令的条数少,而且 指令的功能也比较简单。
▲
2288/75
2.3 指令集结构的功能设计
2.3.1 CISC指令集结构的功能设计
12. 储器操作数。
▲
1133/75
指令集结构类型
优点
缺点
寄存器-寄存器型 (0,3)
指令字长固定,指令结构 简洁,是一种简单的代码 生成模型,各种指令的执 行时钟周期数相近
与指令中含存储器操作数的指令集结 构相比,指令条数多,目标代码不够 紧凑,因而程序占用的空间比较大
寄存器-存储器型 (1,2)
跟其他的CPU内部存储单元一样,寄存器的访问 速度比存储器快。
对编译器而言,能更加容易、有效地分配和使用 寄存器。
寄存器可以用来存放变量。 (1)减少对存储器的访问,加快程序的执行速度; (因为寄存器比存储器快)
▲
9/975
2.1 指令集结构的分类
(2)用更少的地址位(相对于存储器地址来说)来对寄 存器进行寻址,从而有效地减少程序的目标代码的 大小。
计算机系统结构—第二章
![计算机系统结构—第二章](https://img.taocdn.com/s3/m/641c3f65dd36a32d737581ed.png)
《Computer Architecture》V3
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容
数据表示
基本概念 基本数据表示 高级数据表示 数据表示设计
《Computer Architecture》V3
同济大学.电子与信息工程学院.计算机科学与工程系
a23
000
a24
……
000
a31
000
a32
000
a33
000
a34
……
《Computer Architecture》V3
本章内容>>数据表示 >>自定义数据表示
5之3
取操作数的过程
操作码 x y 指令 寄存器 描述符 101 101 描述符
《Computer Architecture》V3
…… …
主存储器 101
地址形
000
成逻辑
000
(数据) (数据)
101
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>数据表示 >>自定义数据表示
《Computer Architecture》V3
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>数据表示 >>自定义数据表示
5之2
B-6700中的格式
数据描述符格式 101 标志位 数据块长度 数据块起始地址
数据格式 000
数值
《Computer Architecture》V3
同济大学.电子与信息工程学院.计算机科学与工程系
尾数字长较长可以弥补 精度的损失。 ➢ 小/微型机rm宜取小
计算机系统结构第二章作业及答案
![计算机系统结构第二章作业及答案](https://img.taocdn.com/s3/m/540ab1290066f5335a8121dd.png)
2.2 区别不同指令集结构的主要因素是什么?根据这个主要因素可将指令集结构分为哪3类?答:区别不同指令集结构的主要因素是CPU中用来存储操作数的存储单元。
据此可将指令系统结构分为堆栈结构、累加器结构和通用寄存器结构。
2.6 简述CISC指令集结构功能设计的主要目标。
从当前计算机技术观点来看,CISC指令集结构的计算机有什么缺点?答:主要目标是增强指令功能,把越来越多的功能交由硬件来实现,并且指令的数量也是越来越多。
缺点:(1) CISC结构的指令集中,各种指令的使用频率相差悬殊。
(2)CISC结构指令的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。
(3)CISC结构指令集的复杂性给VLSI设计增加了很大负担,不利于单片集成。
(4)CISC结构的指令集中,许多复杂指令需要很复杂的操作,因而运行速度慢。
(5) 在CISC结构的指令集中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。
2.7 简述RISC指令集结构的设计原则。
答(1)选取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;(3)所有指令长度均相同;(4)只有Load和Store 操作指令才访问存储器,其它指令操作均在寄存器之间进行; (5) 以简单有效的方式支持高级语言。
2.8 指令中表示操作数类型的方法有哪几种?答:操作数类型有两种表示方法:(1)操作数的类型由操作码的编码指定,这是最常见的一种方法;(2)数据可以附上由硬件解释的标记,由这些标记指定操作数的类型,从而选择适当的运算。
2.9 表示寻址方式的主要方法有哪些?简述这些方法的优缺点。
答:表示寻址方式有两种常用的方法:(1)将寻址方式编于操作码中,由操作码在描述指令的同时也描述了相应的寻址方式。
这种方式译码快,但操作码和寻址方式的结合不仅增加了指令的条数,导致了指令的多样性,而且增加了CPU对指令译码的难度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9
Principles - Computer Design Or Speedup = (Execution time for entire task without using the enhancement)/ (Execution time for the entire task using the enhancement when possible). Speedup tells us how much faster a task will run using the machine with the enhancement as opposed to the original machine.
1.
Then WAM =
2.
Weight Tim e
i 1 i i
n
n Wi 1 i 1
Weighted Harmonic Mean (WHM) 1 WHM =
Weighti i 1 Rate i
Both WAM and WHM will give a clearer picture (in relative terms) of performance when different workloads (i.e. portions of P1, P2..) are involved with different machines.
Average normalized execution time can be expressed as either arithmetic or geometric means (GM) where :
6
Principles - Benchmark Suites
GM n
execution_ tim e_ ratio
n
5
Principles - Benchmark Suites
A further approach has been tried when unequal mixtures of programs are involved in each machine’s workload. This involves normalizing execution times to a reference machine, and then take the average of the normalized execution times.
In making design tradeoff, favor the frequent case over the infrequent case. This will help performance. The frequent case is often simpler and can be done faster than the infrequent case. e.g. overflow in CPU’s In applying this principle, we have to decide what the frequent case is and how much performance can be improved by making that case faster.
4
However, these two approaches only remain valid if each of the (benchmark) programs (say P1 and P2) were run an equal number of times on each machine. If different workloads are required (i.e. P1 and P2 are not running equally often on each machine) then two further approaches using weighted means may be then used to represent (summarize) relative l important guidelines, principles and equations which are very useful in the analysis and evaluation of a computers design, performance and its cost/performance ratio. 1. Make the Common Case Fast:
2
Principles - Benchmark Suites
Several approaches are used: 1. An average of the time is the Arithmetic Mean n
1 AM Tim ei n i 1
Where Timei is the execution time for the ith program of n programs in the workload.
In other words, it defines the speedup that can be gained by using a particular feature. Speedup factor = (Performance for entire task using the enhancement when possible) / (Performance for entire task without using the enhancement).
2.
3
If the performance is expressed as a rate, then the average that tracks total execution time is the Harmonic mean n HM n 1 i 1 ratei
Principles - Benchmark Suites Where ratei = 1/timei , the reciprocal of the execution time for the ith of n programs in the workload.
8
Principles - Computer Design Amdahl’s law can be used to quantify this principle.
2.
Amdahl’s Law: The performance improvement to be gained from using a faster mode of execution is limited by the fraction of the time the faster mode can be used.
Principles - Benchmark Suites
Weighted arithmetic mean (WAM) Assign a weighting factor (Wi) as follows: If P1 is run 20% of the time : WP1 = 0.2, If P2 is run 80% of the time : WP2 = 0.8,
Department of Computer Science and Computer Engineering
Latrobe University CSE2CSA Computer Architecture
1
Principles - Benchmark Suites Lecture 2
A benchmark is a program – normally a collection of programs into 1 program (the benchmark) and are typically used to measure the performance of the machines. (A typical benchmark is SPEC2006 (p.31) used to characterize performance in the workstation and server markets) Often when comparing and summarizing performance of several benchmarks (programs) over several machines we need a consistent summary measure which accurately reflects performance with respect to execution times.
Amdahl’s Law gives us a quick way to find the speedup from some enhancements by only knowing two factors
10
Principles - Computer Design The fraction of the computation time in the original machine that can be converted to take advantage of the enhancement = fraction enhanced (this is often called percentage of vectorization (POV)) The improvement gained by the enhanced execution mode: that is, how much faster the task would run if the enhanced mode were used for the entire program (i.e. 100% of the time) = speedupenhanced. Then : Execution_timenew