计算机系统结构作业答案第三章(张晨曦)
计算机体系结构课后习题原版答案张晨曦著.doc
第1章计算机系统结构的基本概念1.1解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构, 每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级, 汇编语言机器级,髙级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一•条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完厉,再去髙-•级机器取下一条语句或指令,再进行解释执行,如此反复, 直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
透明性:在计算机技术中,把这种本來存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的纟R成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术筹。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进厉,所能获得的整个系统性能的提髙,受限于该部件的执行•时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方而的处理性能。
存储程序计算机:冯•诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,口动完成rh程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同纟R成和实现的一系列不同型号的计算机。
计算机系统结构__《张晨曦、王志英》课后习题参考答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构(第三版)张晨曦 课后答案
m
平均时钟周期数 1 2 4 2
求该计算机的有效 CPI、MIPS 和程序执行时间。
后
解: CPI =
∑ ( IC × CPI ) / IC
i i
CPI =
f 400 ×10 6 = = 225.225MIPS CPI ×10 6 1.776 ×10 6 程序执行时间=( 45000 × 1 + 75000 × 2 + 8000 × 4 + 1500 × 2 )/400=575⎧s MIPS速率 =
3
按照同样的逐层递推关系,不难求得第四级等效程序的总的执行时间为:
1.2 传统存储程序计算机的主要特征是什么?存在的主要问题是什么?目前的计算机系统 是如何改进的? 存储程序计算机在体系结构上的主要特点: (1) 机器以运算器为中心。 (2) 采用存储程序原理。程序(指令)和数据放在同一存储器中,并且没有对两者加 以区分。指令和数据一样可以送到运算器进行运算,即由指令组成的程序自身 是可以修改的。 (3) 存储器是按地址访问的、线性编址的空间。 (4) 控制流由指令流产生。 (5) 指令由操作码和地址码组成。操作码指明本指令的操作类型,地址码指明操作 数和操作结果的地址。 (6) 数据以二进制编码表示,采用二进制运算。 传统存储程序计算机体系结构存在的主要问题及其改进: (1)分布的 I/O 处理能力 存储程序计算机以运算器为中心、 所有部件的操作都由控制器集中控制, 这一特 点带来了慢速输入输出操作占用快速运算器的矛盾。 为了克服这一缺点, 人们先后提出 各种输入/输出方式。 (2)保护的存储器空间 把指令和数据放在同一存储器中有优缺点。现在绝大多数计算机都规定:在执行 过程中不准修改程序。 (3)存储器组织结构的发展 按地址访问的存储器具有结构简单、价格便宜、存取速度快等优点。但是在数据
计算机系统结构作业答案第三章(张晨曦)
计算机系统结构作业答案第三章(张晨曦)3.1 -3.3为术语解释等解答题。
3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT, ΔT, 2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。
(1) 顺序执行方式(2) 只有“取指令”与“执行指令”重叠(3) “取指令”,“分析指令”与“执行指令”重叠解:(1) 4NΔT(2) (3N+1) ΔT(3) 2(N+1) ΔT3.6 解决流水线瓶颈问题有哪两种常用方法?解:(1) 细分瓶颈段将瓶颈段细分为若干个子瓶颈段(2) 重复设置瓶颈段重复设置瓶颈段,使之并行工作,以此错开处理任务3.9 列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。
for(i = 2; i < 100; i=i+1){a[i] = b[i] + a[i]; -----(1)c[i+1] = a[i] + d[i]; -----(2)a[i-1] = 2*b[i]; -----(3)b[i+1] = 2*b[i]; -----(4)}解:输出相关:第k次循环时(1)与第k+1轮时(3)反相关:第k次循环时(1)和(2)与第k-1轮时(3)真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4)3.12 有一指令流水线如下所示50ns 50ns 100ns 200ns(1)求连续如入10条指令的情况下,该流水线的实际吞吐率和效率(2)该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。
对于你所给出的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少?解:(1)(m表示流水线级数,n 表示任务数)(2)瓶颈在3、4段。
方法一:变成八级流水线(细分)11.7e8方法二:变成两级流水线(合并)方法三:将段1、2 合并为一段,段4 细化流水为两段方法四:重复设置部件,设置2个部件3,4个部件4,和第一种方法结果相同3.14 有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段时间为2Δt,其余各段时间均为Δt,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中,现要在该流水线上计算41()i iiA B =+∏,画出其时空图,并计算其吞吐率、急速比和效率。
计算机体系结构课后习题原版答案 张晨曦著
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机体系结构课后习题原版答案_张晨曦著
第1章计算机系统结构的基本概念........... 错误!未定义书签。
第2章指令集结构的分类................... 错误!未定义书签。
第3章流水线技术......................... 错误!未定义书签。
第4章指令级并行......................... 错误!未定义书签。
第5章存储层次........................... 错误!未定义书签。
第6章输入输出系统........................ 错误!未定义书签。
第1章计算机系统结构的基本概念解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
计算机体系结构课后习题原版答案_张晨曦著
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构__《张晨曦、王志英》课后习题参考答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机体系结构课后习题原版答案张晨曦著
第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构按照计算机语言从低级到高级的次序把计算机系统按功能划分成多级层次结构每一层以一种不同的语言为特征。
这些层次依次为微程序机器级传统机器语言机器级汇编语言机器级高级语言机器级应用语言机器级等。
虚拟机用软件实现的机器。
翻译先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序然后再在这低一级机器上运行实现程序的功能。
解释对于高一级机器上的程序中的每一条语句或指令都是转去执行低一级机器上的一段等效程序。
执行完后再去高一级机器取下一条语句或指令再进行解释执行如此反复直到解释执行完整个程序。
计算机系统结构传统机器程序员所看到的计算机属性即概念性结构与功能特性。
透明性在计算机技术中把这种本来存在的事物或属性但从某种角度看又好像不存在的概念称为透明性。
计算机组成计算机系统结构的逻辑实现包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现计算机组成的物理实现包括处理机、主存等部件的物理结构器件的集成度和速度模块、插件、底板的划分与连接信号传输电源、冷却及整机装配技术等。
系统加速比对系统中某部分进行改进时改进后系统性能提高的倍数。
Amdahl定律当对一个系统中的某个部件进行改进后所能获得的整个系统性能的提高受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理程序执行时所访问的存储器地址不是随机分布的而是相对地簇聚。
包括时间局部性和空间局部性。
CPI每条指令执行的平均时钟周期数。
测试程序套件由各种不同的真实应用程序构成的一组测试程序用来测试计算机在各个方面的处理性能。
存储程序计算机冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中机器一旦启动就能按照程序指定的逻辑顺序执行这些程序自动完成由程序所描述的处理工作。
系列机由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
软件兼容一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。
计算机体系结构课后习题原版答案张晨曦著
第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构按照计算机语言从低级到高级的次序把计算机系统按功能划分成多级层次结构每一层以一种不同的语言为特征。
这些层次依次为微程序机器级传统机器语言机器级汇编语言机器级高级语言机器级应用语言机器级等。
虚拟机用软件实现的机器。
翻译先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序然后再在这低一级机器上运行实现程序的功能。
解释对于高一级机器上的程序中的每一条语句或指令都是转去执行低一级机器上的一段等效程序。
执行完后再去高一级机器取下一条语句或指令再进行解释执行如此反复直到解释执行完整个程序。
计算机系统结构传统机器程序员所看到的计算机属性即概念性结构与功能特性。
透明性在计算机技术中把这种本来存在的事物或属性但从某种角度看又好像不存在的概念称为透明性。
计算机组成计算机系统结构的逻辑实现包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现计算机组成的物理实现包括处理机、主存等部件的物理结构器件的集成度和速度模块、插件、底板的划分与连接信号传输电源、冷却及整机装配技术等。
系统加速比对系统中某部分进行改进时改进后系统性能提高的倍数。
Amdahl定律当对一个系统中的某个部件进行改进后所能获得的整个系统性能的提高受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理程序执行时所访问的存储器地址不是随机分布的而是相对地簇聚。
包括时间局部性和空间局部性。
CPI每条指令执行的平均时钟周期数。
测试程序套件由各种不同的真实应用程序构成的一组测试程序用来测试计算机在各个方面的处理性能。
存储程序计算机冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中机器一旦启动就能按照程序指定的逻辑顺序执行这些程序自动完成由程序所描述的处理工作。
系列机由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
软件兼容一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。
《计算机系统结构》(张晨曦 王志英 着) 课后习题答案 高等教育出版社
系统结构习题第一章1. 1 解释下列术语:层次结构,计算机系统结构,计算机组成,计算机实现,透明性,由上而下设计,由下而上设计,由中间向两边设计,软件兼容,向上兼容,固件,系列机,兼容机,模拟,仿真,虚拟机,宿主机,指令流,数据流,单指令流单数据流,多指令流多数据流,CPI,MIPS,Amdahl定律。
1.2 存储程序计算机的主要特征是什么?存在的主要问题是什么?目前的计算机系统是如何改进的?1.3 从机器(汇编)语言程序员看,以下哪些是透明的?指令地址寄存器,指令缓冲器,时标发生器,先行进位链,条件码寄存器,乘法器,主存地址寄存器,移位寄存器,通用寄存器,中断字寄存器,磁盘外设。
1.4 如有一个经解释实现的计算机,可以按功能分成4级。
每一级为了执行一条指令需要下一级N条指令解释。
若执行第一级的一条指令需Kns时间,那么执行第2、3、4级的一条指令各需要用多少时间?1.5 假定你是一个计算机设计者,对高级语言结构的使用研究表明,过程调用是最常用的操作之一。
你已设想了一个优化设计方案,它能减少过程调用和返回所需的取/存指令次数。
为了进行验证,对未加优化和已优化的方案进行实验测试,假定所使用的是相同的优化编译器。
实验测得的结果如下:(1) 未优化的时钟周期比优化的快5%;(2) 未优化方案中的取/存指令数占总指令数的30%;(3) 优化方案中的取/存指令数比未优化的少1/3,对于其他指令,两种方案的动态执行数没有变化;(4) 所有指令,包括取/存指令,均只需要1个时钟周期。
要求你定量地判断,哪一种设计方案的计算机工作速度更快。
1.6 假设在一台40MHz处理器上运行200 000条指令的目标代码,程序主要由四种指令组成。
根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下:指令类型CPI指令混合比算术和逻辑高速缓存命中的加载/存储转移高速缓存缺失的存储器访问124860%18%12%10%(1) 计算在单处理机上用上述跟踪数据运行程序的平均CPI。
计算机系统结构张晨曦版课后答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯•诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
(完整版)计算机系统结构张晨曦版课后答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯•诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
【课后习题及答案】计算机体系结构课后习题原版答案-张晨曦著
答:如在设计主存系统时,确定主存容量、编址方式、寻址范围等属 于计算机系统结构。确定主存周期、逻辑上是否采用并行主存、逻辑 设计等属于计算机组成。选择存储芯片类型、微组装技术、线路设计 等属于计算机实现。 计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成 的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实 现。 1.3 计算机系统结构的 Flynn 分类法是按什么来分类的?共分为哪几 类? 答:Flynn 分类法是按照指令流和数据流的多倍性进行分类。把计算 机系统的结构分为: 单指令流单数据流 SISD 单指令流多数据流 SIMD 多指令流单数据流 MISD 多指令流多数据流 MIMD 1.4 计算机系统设计中经常使用的 4 个定量原理是什么?并说出它们 的含义。 答:(1)以经常性事件为重点。在计算机系统的设计中,对经常发生 的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的 改进。(2)Amdahl 定律。加快某部件执行速度所获得的系统性能加 速比,受限于该部件在系统中所占的重要性。(3)CPU 性能公式。 执行一个程序所需的 CPU 时间 = IC ×CPI ×时钟周期时间。(4) 程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而 是相对地簇聚。 1.5 分别从执行程序的角度和处理数据的角度来看,计算机系统中并
精品课程
课后习题答案Байду номын сангаас
计算机体系结构-张晨曦著 课后习题及答案
第 1 章 计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功 能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次 依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高 级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效 的程序,然后再在这低一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执 行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一 条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程 序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结 构与功能特性。 透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种 角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据 流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物 理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信 号传输,电源、冷却及整机装配技术等。
计算机系统结构__《张晨曦、王志英》课后习题参考答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
《计算机体系结构(张晨曦)》课后习题答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
F =( A1+ B1)·( A2+ B2)·( A3+ B3)·( A4+ B4)
⑴⑵⑶⑷
(5)(6)
(7)
时空图如下:
空
间
S5
1
2
3
4
5
6
7
S4
12Βιβλιοθήκη 34S31
1
2
2
3
3
4
4
S2
5
6
7
S1
1
2
3
4
5
6
7
时
间
18
Δt
(2)Tk =18Δt,TP = 7/18Δt,S = 29/18=1.611,E =29/(18*5)=29/90≈32.2%
(2)实际吞吐率为
3.15
一动态多功能流水线由6个功能段组成,如下图(图4):
图4
其中:S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线,每个功能段时间均为50ns。假定该流水线的输出结果可以直接返回流水线输入端,而且设置有足够的缓冲寄存器。若按照最快的方式用该流水线计算 。
①请画出其处理过程的时空图。
S3
11
12
13
14
S2
11
12
13
14
S1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
时
间
22
Δt
(2).Tk = 22Δt,TP = 7/11Δt=7/(11*50ns)=12.727e6,S = 28/11=2.555,E = 14/33=42.42%
3.18、在Cray 1机上,按链接方式执行下面4条向量指令(括号中给出相应功能部件时间),如果向量寄存器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?如果向量长度为64,则需要多少拍能得到全部结果。
(1) 4NΔT
(2)(3N+1)ΔT
(3) 2(N+1)ΔT
3.6解决流水线瓶颈问题有哪两种常用方法?
解:
(1)细分瓶颈段
将瓶颈段细分为若干个子瓶颈段
(2)重复设置瓶颈段
重复设置瓶颈段,使之并行工作,以此错开处理任务
3.9列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。
for(i= 2; i < 100; i=i+1)
真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4)
3.12有一指令流水线如下所示
入 出
50ns50ns100ns 200ns
(1)求连续如入10条指令的情况下,该流水线的实际吞吐率和效率
(2)该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少?
V0←存储器(存储器取数:7拍)
V2←V0+V1 (向量加:3拍)
V3←V2<A3 (按照A3左移:4拍)
V5←V3∧V4 (向量逻辑乘:2拍)
解答:
四条指令每前后两条依次存在先写后读相关,故流水线经过时间为(1+7+1) + (1+3+1) + (1+4+1) + (1+2+1) = 24。
如果向量长度为64,则需24 + (64-1) = 87拍能得到全部结果。
(1)求此链接流水线的流过时间为多少拍?(设寄存器入,出各需1拍)。
(2)假设每拍时间为50ns,完成这些计算并把结果存进相应寄存器,此部件的实际的吞吐率是多少MFLOPS?
解答:
(1) (A+B)*C可用以下2条指令完成:
V0←A+B
V1←V0*C
流水线流过时间为(1+2+1) + (1+3+1) = 9拍
解:(1)(m表示流水线级数,n表示任务数)
(2)瓶颈在3、4段。
方法一:变成八级流水线(细分)
11.7e8
方法二:变成两级流水线(合并)
方法三:将段1、2合并为一段,段4细化流水为两段
方法四:重复设置部件,设置2个部件3,4个部件4,和第一种方法结果相同
3.14有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段时间为2Δt,其余各段时间均为Δt,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中,现要在该流水线上计算 ,画出其时空图,并计算其吞吐率、急速比和效率。
3.19、某机有16个向量寄存器,其中V0~V5中分别放有向量A、B、C、D、E、F,向量长度均为8,向量各元素均为浮点数;处理部件采用二个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。用类似Cray 1的链接技术,先计算(A+B)*C,在流水线不停流的情况下,接着计算(D+E)*F。
3.1-3.3为术语解释等解答题。
3.4设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT,ΔT,2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。
(1)顺序执行方式
(2)只有“取指令”与“执行指令”重叠
(3)“取指令”,“分析指令”与“执行指令”重叠
解:
②计算其实际吞吐率,加速比和效率。
解:(1).任务划分如下:
F = X1·Y1·Z1+ X2·Y2·Z2+ X3·Y3·Z3+ X4·Y4·Z4+ X5·Y5·Z5
⑴⑵⑶⑷⑸
⑹⑺⑻⑼⑽
⑾⑿
⒀
⒁
时空图如下:
空
间
S6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
S5
1
2
3
4
5
6
7
8
9
10
S4
1
2
3
4
5
6
7
8
9
10
{
a[i] = b[i] + a[i];-----(1)
c[i+1] = a[i] + d[i];-----(2)
a[i-1] = 2*b[i];-----(3)
b[i+1] = 2*b[i];-----(4)
}
解:
输出相关:第k次循环时(1)与第k+1轮时(3)
反相关:第k次循环时(1)和(2)与第k-1轮时(3)