计算机体系结构读书笔记

《高级计算机系统结构》

读书笔记

所在学院：

姓名：

学号：

2019年12月20日

写在前面的：这里是第六章的读书笔记

Storage Systems存储系统

1.介绍

1）为什么I/O是计算机体系结构中的一部分？

I/O很容易以被专注于CPU的人忽略，然而输入/输出是计算机体系结构中一个很重要的部分。

CPU时间：是指一段程序在CPU上面运行消耗的时间，也是内核时间；

响应时间：用户输入命令和结果输出之间的时间。

CPU的设计设关注于CPU时间，而用户真正在意的是响应时间，响应时间用来衡量计算机的性能似乎更为合理。而事实上，一味盲目地提高CPU的速度而忽略I/O速度，会阻碍CPU性能的释放，比如：CPU提速10倍，而I/O速度不变，根据Amdahl定律，计算机将只能提速5倍，剩下的5倍是浪费掉了。由于受到I/O速度的限制，用户不必去买更快的CPU。而大部分计算机都是单用户单处理器，因此I/O的速率会对计算机的速度产生很大的影响。

2.存储器设备的类型

2.1磁盘

1）磁盘在计算机中的作用

·长期非易事文件存储

·虚拟内存

2）磁盘的结构

磁盘是由许多个盘片组成，每个盘面都被划分为数目相等的磁道，并从外缘的“0”开始编号，具有相同编号的磁道形成一个圆柱，称之为磁盘的柱面。每一个盘片都有两个盘面，即上、下两个盘面，都可以用来存储数据。每一个有效盘面都有一个盘面号。在硬磁盘系统中，盘面号又叫磁头号，因为每一个有效盘面都有一个对应的读写磁头。下图显示的是一个盘面，盘面中一圈圈灰色同心圆为一条条磁道，从圆心向外画直线，可以将磁道划分为若干个弧段，每个磁道上一个弧段被称之为一个扇区（图示绿色部分）。扇区是磁盘的最小组成单元，通常是512字节。（由于不断提高磁盘的大小，部分厂商设定每个扇区的大小是4096字节）。

所以读取磁盘必须要获取这块待读扇区对应的柱面号(cylinder)、磁头号(head)、扇区号(sector)。

3）重要指标

寻道时间：把磁头从当前位置移动到指定的磁道所需要的时间。

通常表示为：T=m*n+s

平均旋转时间：欲访问扇区旋转到磁头下面所需要的时间，通常可以认为是半周旋转时间。多数磁盘转速为3600RPM，所以平均旋转时间为：0.5

3600RPM

传输时间：把数据从磁盘读出或向磁盘写入所需要的时间

4）磁盘访问时间

磁盘访问时间=寻道时间+旋转时间+传输时间

5）磁盘的未来

磁盘业一直致力于提高磁盘的容量，容量的提高通常用存储密度表示，单位是每平方英寸的比特数：

存储密度=（结点数据本身所占的存储量）/（结点结构所占的存储总量）存储密度每三年翻一翻，存储密度的上升，对应成本的下降，因此，硬盘的价格越来越低，体积变小。

磁盘比DRAM便宜的多，但DRAM的速度比磁盘快得多

2.2用DRAMs作为磁盘

1）SSD和ES

a．SSD有DRAM和电池组成，使系统不易失，ES是一种只允许块传输到主存储器或从主存储器传输数据的大存储器。

b. SSD的作用类似于软件控制的缓存（在块传输期间，CPU暂停），而ssd涉及操作系统，就像从磁盘传输一样。

c. 与主存储器和ES不同，ssd可以由多个cpu共享，因为它们作为单独的单元工作。

优点：ssd和ES具有非易失性、寻道时间短、电位转移率高、可靠性高等优点。缺点：ssd和ES的缺点是成本，每兆字节成本至少是磁盘成本的50倍。

2.3光盘

CDROM是可移动的，制造成本低廉，但它是一种只读介质。

2.4磁带和自动磁带库

磁带成为磁盘备份的首选技术

3.连接I/O设备和CPU/内存的总线

1）总线的定义及优缺点

定义：总线是各种功能部件之间传送信息的公共通信干线，计算机有运算器，控制器，存储器，输入输出设备这五大组件，所以总线就是用来连接这些组件的导线。

优点：共享通信链路，低成本（一组总线以多种方式共享），多功能。

缺点：总线的主要缺点是它造成了通信瓶颈，可能限制了最大I/O吞吐量

2）总线的设计规则

3）总线标准

大多数计算机系统上的I/O设备的数量和种类都不是固定的，这使得客户可以根据自己的需要定制计算机。使计算机设计人员和I/O设备设计人员能够独立工作的标准在确定总线的选择方面起着很大的作用。实际上，I/O总线标准是定义如何连接它们。

表3-2 五种I/O总线的特征总结(前两个从CPU内存总线开始，演变为I/O总线)

表3-3 CPU-内存总线

4）存储设备与CPU的连接

两种选择，要么连接到内存，要么连接到缓存。

①将I/O总线连接到内存总线的情况

一个典型的做法I/O总线是内存总线，这意味着总线上的I/O命令可能会干扰CPU指令获取。

CPU如何处理它需要发送或接收数据的I/O设备？

最常见的做法称为内存映射I/O。在这种方案中，地址空间的一部分被分配给I/O设备。对这些地址的读取和写入可能会导致数据传输；I/O空间的一部分也可能预留给设备控制，因此对设备的命令只是访问那些已存储的地址。另一种做法是在CPU中使用专用的I/O操作码。在这种情况下，CPU发送一个信号，表明这个地址是用于I/O设备的。带有I/O指令的计算机的例子是Intel 80x86和IBM 370计算机。I/O操作码越来越受欢迎。无论选择哪种寻址方式，每个I/O 设备都有寄存器来提供状态和控制信息。通过加载并存储在内存映射的I/O或通

过特殊指令，CPU设置标志以确定I/O设备将执行的操作。

②将I/O总线直接连接到缓存

优点：由于中断驱动的I/O使CPU不再等待每一个I/O事件，但仍有许多CPU周期用于传输数据。由于I/O事件经常涉及块传输，直接内存访问（DMA）硬件被应用到到许多计算机系统中，以允许在不受CPU干预的情况下传输字数。DMA是一种专门的处理器，它在CPU执行其他任务的同时，在存储器和I/O设备之间传输数据。DMA是CPU外部的，充当总线上的主控。CPU首先设置DMA寄存器，其中包含内存地址和要传输的字节数。一旦DMA传输完成，控制器就会中断CPU。提高DMA设备的智能性可以进一步减轻CPU的负担。称为I/O处理器（或I/O控制器或通道控制器）的设备可以从固定程序或操作系统下载的程序运行。操作系统通常建立一个I/O控制块队列，其中包含数据位置（源和目标）和数据大小等信息。然后，I/O处理器从队列中获取项目，执行请求的所有操作，并在I/O控制块中指定的任务完成时发送单个中断。虽然LPI 1行打印机会导致4800个中断打印60行80字符的页面，但I/O处理器可以节省4799个中断。I/O处理器类似于多处理器，因为它们有助于在计算机系统中同时执行多个进程。

缺点：I/O处理器的通用性不如cpu，因为它们有专门的任务，因此并行性也受到很大的限制。此外，I/O处理器通常不会像CPU那样更改信息，而只是将信息从一个地方移动到另一个地方。

4.I/O性能指标

1）传统性能指标

响应时间：也称为延迟，即I/O的响应时间，是操作系统从内核发出一个I/O请求到接收到I/O响应的时间，因此，I/O reponse time除了包括磁盘获取数据的时间，还包括了操作系统以及存储系统内部I/O等待的时间；

I/O吞吐量：也称为I/O带宽，服务器在一段时间内完成任务书的平均值。这个指标衡量标识了最大数据传输量;这个值在顺序访问或者大数据量访问的情况下会比较重要。尤其是在大数据读写的时候，吞吐量一般受限于一些比较固定的因素，如网络带宽、I/O传输接口的带宽、硬盘接口带宽等，一般它的值就等于上面几个地方中某一个的瓶颈；

这样为了获得尽可能高的吞吐量，服务器不应该空闲，因此缓冲区不应该为空。另一方面，响应时间计算在缓冲区中花费的时间，因此缓冲区为空会使响应时间最小化

I/O对CPU执行的干扰：传输数据可能会干扰另一个进程的执行。处理I/O 中断也会产生开销。我们关心的是，由于另一个进程的I/O，一个进程需要多多少个时钟周期；

2）排队理论预测存储子系统性能：

3）测量实际系统的性能

事务处理基准（TP）：主要与I/O速率有关：每秒访问磁盘的次数，与数据速率相反，以每秒数据字节数来度量。TP通常涉及对来自多个终端的大量共享信息的更改，TP系统保证在发生故障时的正确行为。

规范系统级文件服务器（SFS）基准：规范基准测试工作以其对处理器性能的描述而闻名，但它也扩展到其他领域。与TPC-B一样，SFS根据报告的吞吐量来扩展文件系统的大小：对于每秒100个NFS操作，容量必须增加1 GB。

自缩放l/O基准：第一步是一个自伸缩基准，它根据被测系统的性能特征自动动态地调整其工作负载的几个方面。这种标度比TPC-B和SFS中的标度更为普遍，因为这里的标度根据被测系统的特性而不仅仅是一个，改变了五个参数。基准首先根据系统的性能为五个参数中的每一个选择一个标称值。然后依次改变每个参数，而其他四个参数保持其固定的标称值。自伸缩基准测试增加了我们对系统的理解，并随着技术的进步而扩展工作负载以保持相关性。然而，它使比较两个系统的结果的任务复杂化。使用这个基准评估了第6.8节中的系统。

5.可靠性可用性和RAIO

虽然吞吐量和响应时间在处理器设计中有相似之处，但在存储中可靠性比在处理器中受到更多的关注。

可靠性：可靠性描述的是是否有任何损坏。

可用性：可用性描述的是对用户来说是否可以使用。

因此，添加硬件可以提高可用性（例如，内存上的ECC），但不能提高可靠性（DRAM仍然损坏）。只有通过改善环境条件、使用更可靠的组件进行构建或使用更少的组件进行构建，才能提高可靠性。

磁盘阵列：提高存储系统可用性和性能的一项创新是磁盘阵列。由于每兆字节的价格与磁盘大小无关，因此，通过拥有多个磁盘驱动器和多个磁盘臂，可以提高潜在的吞吐量。阵列的缺点是，随着设备的增多，可靠性下降：N个设备通

常具有l/N单个设备的可靠性。当每个磁盘都有相同的故障率时，虽然磁盘阵列永远不会比较小数量的较大磁盘更可靠，但是可以通过添加冗余磁盘来提高可用性。如果单个磁盘发生故障，则可以从冗余信息中重建丢失的信息。唯一的危险是在一个磁盘发生故障和被替换之间发生另一个磁盘故障（称为平均修复时间或MTTR）。由于磁盘的平均故障时间（MTTF）为5年或5年以上，并且MTTR是以小时为单位测量的，因此冗余可以使100个磁盘的可用性远远高于单个磁盘。这些系统已经被简称为RAID，代表廉价磁盘的冗余阵列。有几种冗余方法具有不同的开销和性能。

RAID1：每当数据写入一个磁盘时，该数据也会写入一个冗余磁盘，因此始终有两个信息副本。

RAID3：使用一个专门的磁盘存放所有的校验数据，而在剩余的磁盘中创建带区集分散数据的读写操作

RAID5：可以计算出任何一个带有区校验块的存放位置，这样就可以确定任何对校验块进行的读写操作都会在所有的TRAID5磁盘中进行均衡，从而消除了产生瓶颈的可能。

6.跨邻域问题：与操作系统的接口

1）缓存导致操作系统出现陈旧数据问题

缓存意味着可能有两个数据副本，一个用于缓存和主内存，而虚拟内存可以产生三个用于缓存、内存和磁盘的副本。操作系统或硬件必须确保CPU读取最近输入的数据，并且I/O在存在缓存和虚拟内存的情况下输出正确的数据。是否出现陈旧数据问题在一定程度上取决于I/O连接到计算机的位置。陈旧数据问题有两部分：I/O系统在输出时看到陈旧的数据，因为内存不是最新的；在I/O系统更新内存后，CPU在输入时看到缓存中的陈旧数据。

第一个难题是，如果存在高速缓存且I/O连接到内存，如何输出正确的数据。直写缓存通过确保内存与缓存具有相同的数据来解决这个问题。写回缓存要求操作系统刷新输出地址，以确保它们不在缓存中。这种刷新需要时间，即使数据不在缓存中，因为地址检查是连续的。或者，硬件可以在输出期间检查缓存标记，

以查看它们是否在写回缓存中，并且仅当输出尝试读取缓存中的数据时才与缓存交互。第二个问题是确保缓存在输入后不会有过时的数据。操作系统可以保证输入数据区域不可能在缓存中。如果不能保证这一点，操作系统将刷新输入地址，以确保它们不在缓存中。同样，无论输入地址是否在缓存中，这都需要时间。和以前一样，可以添加额外的硬件来检查输入期间的标记，如果有冲突，则使数据无效。

2）DMA和虚拟内存

DMA是Direct Memory Access,直接存储器访问。DMA的出现就是为了解决批量数据的输入/输出问题。DMA是指外部设备不通过CPU而直接与系统内存交换数据的接口技术。这样数据的传送速度就取决于存储器和外设的工作速度。

虚拟内存是弥补内存不足的问题，虚拟DMA允许DMA使用在DMA期间映射到物理地址的虚拟地址。因此，虚拟内存中的缓冲区必须是连续的，但页面可以分散在物理内存中。如果使用虚拟DMA移动进程，操作系统可以更新DMA 的地址表，或者操作系统可以锁定内存中的页面，直到DMA完成。

7.设计I/O系统

I/O的艺术在于找到一种既能满足成本和设备种类目标，又能避免I/O性能瓶颈的设计。这意味着组件必须在主内存和I/O设备之间保持平衡，因为性能和有效的成本/性能只能与I/O链中最薄弱的环节一样好。思路如下：

1.列出要连接到机器的不同类型的I/O设备，或列出机器将支持的标准总

线。

2.列出每个I/O设备的物理要求。这包括卷、电源、连接器、总线插槽、扩

展柜等。

3.列出每个I/O设备的成本，包括该设备所需的任何控制器的成本部分。

4.记录每个I/O设备的CPU资源需求。这应该包括

·用于启动I/O、支持I/O设备操作（如处理中断）和完成I/O的指令的时钟周期

·n由于等待I/O使用内存、总线或缓存完成而导致CPU时钟暂停

·n从I/O活动（如缓存刷新）恢复的CPU时钟周期

5.列出每个I/O设备的内存和I/O总线资源需求。即使CPU不使用内存，

主存和I/O总线的带宽也是有限的。

6.最后一步是评估组织这些I/O设备的不同方法的性能。虽然可以用排队

论来估计性能，但只能用仿真来正确地评估性能。

然后根据性能和成本选择最优方案。

成本/性能目标影响I/O方案的选择和物理设计。根据应用程序的需要，性能可以测量为每秒兆字节或每秒I/O。对于高性能，唯一的限制应该是I/O设备的速度、I/O设备的数量以及内存和CPU的速度。为了降低成本，唯一的开销应该是I/O设备本身的开销和连接到CPU的开销。当然，成本/性能设计力求两全其美。

另外本节还介绍了几个例子。

8.放在一起：UNIX文件系统

本节比较了1995年使用的几种操作系统和硬件系统的文件系统性能。这个评估证明：I/O性能受到磁盘和操作系统之间的最薄弱环节的限制。硬件决定了潜在的I/O性能，但操作系统决定了潜在的I/O性能有多大。特别是，对于UNIX 系统，文件缓存对I/O性能至关重要。主要的观察结果是UNIX在大型机和小型超级计算机上的文件缓存性能并不优于工作站，而文件缓存策略是最重要的。优化的内存系统可以提高读取性能，但是写操作系统策略可能导致文件缓存性能的数量级差异。

表8-1 1995年使用的几种操作系统和硬件系统的文件系统性能

磁盘子系统性能

许多工作站I/O子系统可以维持高速单个磁盘的性能，RAID磁盘阵列可以提供更高的性能，并且在虚拟机下运行AIX/ESA的3090 6005型计算机上，单个主机磁盘的性能不比许多工作站快。

基本文件缓存性能

对于UNIX系统，I/O性能中最重要的因素不是磁盘的速度或使用效率。操作系统设计人员对性能的关注导致他们进行类似缓存的优化，使用主内存作为磁盘流量的缓存，以提高I/O性能。因为主存比磁盘快得多。文件缓存可以显著提高性能，在每个UNIX操作系统中都可以找到。从文件缓存读取数据的机器比从磁盘读取数据快3到25倍，文件缓存的性能由处理器、缓存、CPU内存总线、主内存和操作系统决定。

硬件决定了潜在的I/O性能，但操作系统决定了潜在性能。

结论：文件缓存策略决定了大多数I/O事件的性能，因此是提高I/O性能

的起点；工作站中的文件缓存性能正在迅速提高；UNIX在大型机和小型超级

计算机上的文件缓存性能并不比在工作站上好；工作站可以利用高性能磁盘；RAID系统可以提供更高的磁盘性能，但无法克服文件缓存策略中的弱点

9.谬论和陷阱

谬论：计算机系统中磁盘的平均寻道时间是寻道气缸数的三分之一。

这种谬误来自于混淆制造商销售磁盘的方式与预期性能，以及错误的假设，即寻道时间在距离上是线性的。经验法则的三分之一距离来自于计算搜索从一个随机位置到另一个随机位置的距离，不包括当前圆柱体，并且假设存在大量圆柱体。

陷阱：将功能从CPU转移到I/O处理器以提高性能。

虽然l/O处理器可以提高性能，但有很多这样的陷阱。计算机家族固有的一个问题是，I/O特性的迁移通常会以程序员可见的方式改变指令集体系结构或系统体系结构，导致所有未来的计算机都必须接受过去有意义的决定。如果CPU 的成本/性能比I/O处理器提高得更快（很可能是这种情况），那么移动该功能可能会导致下一个CPU中的机器变慢。随着CPU的速度越来越快，搜索的CPU 时间变得微不足道。虽然这种策略使早期的机器更快，但是在I/O处理器中使用搜索键操作的程序在今天的机器上运行速度几乎慢了6倍！

总结

通过本章的学习，首先对I/O的重要性有了更深一步的了解，I/O对系统性能和有效性的限制，明白了I/O是计算机体系结构中的一个至关重要的组成部分，扩展了关于I/O基本知识和技术的储备。

计算机体系结构试题及答案版本

计算机体系结构试题及答案 1、计算机高性能发展受益于：(1) 电路技术的发展；(2) 计算机体系结构技术的发展。 2、层次结构：计算机系统可以按语言的功能划分为多级层次结构，每一层以不同的语言为特征。第六级：应用语言虚拟机-> 第五级：高级语言虚拟机-> 第四级：汇编语言虚拟机-> 第三级：操作系统虚拟机->第二级：机器语言(传统机器级) -> 第一级：微程序机器级。 3、计算机体系结构：程序员所看到的计算机的属性，即概括性结构与功能特性。 4、透明性：在计算机技术中，对本来存在的事物或属性，从某一角度来看又好像不存在的概念称为透明性。 5、Amdahl 提出的体系结构是指机器语言级程序员所看见的计算机属性。 6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定，也就是指令集的设计，该界面之上由软件的功能实现，界面之下由硬件和固件的功能来实现。 7、计算机组织是计算机系统的逻辑实现；计算机实现是计算机系统的物理实现。

8、计算机体系结构、计算机组织、计算机实现的区别和联系？答：一种体系结构可以有多种组成，一种组成可以有多种物理实现，体系结构包括对组织与实现的研究。 9、系列机：是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。 10、软件兼容：即同一个软件可以不加修改地运行于系统结构相同的各机器，而且它们所获得的结果一样，差别只在于运行时间的不同。 11、兼容机：不同厂家生产的、具有相同体系结构的计算机。 12、向后兼容是软件兼容的根本特征，也是系列机的根本特征。 13、当今计算机领域市场可划分为：服务器、桌面系统、嵌入式计算三大领域。 14、摩尔定律：集成电路密度大约每两年翻一番。 15、定量分析技术基础（1）性能的评测：（a）响应时间：从事件开始到结束之间的时间；计算机完成某一任务所花费的全部时间。（b）流量：单位时间内所完成的工作量。（c ）假定两台计算机x 、y；x 比y 快意思为：对于给定任务，x 的响应时间比y少。x的性能是y的几倍是指：响应时间x / 响应时间y = n ，响应时间与性能成反比。

计算机体系结构解

————————————————————————————————作者：————————————————————————————————日期：

第一章计算机组成原理本部分要求掌握计算机方面的基础知识，包括计算机的发展、计算的系统组成、基本组成和工作原理、计算机的数制数据表示以及运算校验、指令系统以及计算机系统的安全等基础性的知识。内容多而且复杂，尤其是有关计算机硬件方面的内容，很细而且灵活性不高，知识量相当大，掌握这部分一定要多下功夫，学会取舍、把握重点、抓住要害。 1.1 考试大纲及历年考题知识点 1.1.1 大纲要求考试要求： 1 掌握数据表示、算术和逻辑运算； 2 掌握计算机体系结构以及各主要部件的性能和基本工作原理考试范围 1 计算机科学基础 1.1 数制及其转换二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 ?数的表示（原码、反码、补码、移码表示，整数和实数的机内表示，精度和溢出）?非数值表示（字符和汉字表示、声音表示、图像表示） ?校验方法和校验码（奇偶校验码、海明校验码、循环冗余校验码） 1.3 算术运算和逻辑运算 ?计算机中的二进制数运算方法 ?逻辑代数的基本运算和逻辑表达式的化简 2．计算机系统知识 2.1 计算机系统的组成、体系结构分类及特性 ?CPU 和存储器的组成、性能和基本工作原理 ?常用I/O 设备、通信设备的性能，以及基本工作原理 ?I/O 接口的功能、类型和特性 ?I/O 控制方式（中断系统、DMA、I/O 处理机方式） ?CISC/RISC，流水线操作，多处理机，并行处理 2.2 存储系统 ?主存-Cache 存储系统的工作原理 ?虚拟存储器基本工作原理，多级存储体系的性能价格 ?RAID 类型和特性 2.3 安全性、可靠性与系统性能评测基础知识 ?诊断与容错 ?系统可靠性分析评价 ?计算机系统性能评测方式 1.2 计算机科学基础 1.2.1 数制及其转换 1、R 进制转换成十进制的方法按权展开法:先写成多项式,然后计算十进制结果. 举例： (1101.01)2=1×2^3+1×2^2+0×2^1+1×2^0+ 0×2^-1+1×2^-2 =8+4+1+0.25=13.25 (237)8=2×8^2+3×8^1+7×8^0 =128+24+7=159 (10D)16=1×16^2+13×16^0=256+13=269

计算机系统结构发展历程及未来展望

计算机系统结构发展历程及未来展望一、计算机体系结构什么是体系结构经典的关于“计算机体系结构（computer Architecture）”的定义是1964年C.M.Amdahl在介绍IBM360系统时提出的，其具体描述为“计算机体系结构是程序员所看到的计算机的属性，即概念性结构与功能特性” 。按照计算机系统的多级层次结构，不同级程序员所看到的计算机具有不同的属性。一般来说，低级机器的属性对于高层机器程序员基本是透明的，通常所说的计算机体系结构主要指机器语言级机器的系统结构。计算机体系结构就是适当地组织在一起的一系列系统元素的集合，这些系统元素互相配合、相互协作，通过对信息的处理而完成预先定义的目标。通常包含的系统元素有：计算机软件、计算机硬件、人员、数据库、文档和过程。其中，软件是程序、数据库和相关文档的集合，用于实现所需要的逻辑方法、过程或控制；硬件是提供计算能力的电子设备和提供外部世界功能的电子机械设备(例如传感器、马达、水泵等)；人员是硬件和软件的用户和操作者；数据库是通过软件访问的大型的、有组织的信息集合；文档是描述系统使用方法的手册、表格、图形及其他描述性信息；过程是一系列步骤，它们定义了每个系统元素的特定使用方法或系统驻留的过程性语境。体系结构原理计算机体系结构解决的是计算机系统在总体上、功能上需要解决的问题，它和计算机组成、计算机实现是不同的概念。一种体系结构可能有多种组成，一种组成也可能有多种物理实现。计算机系统结构的逻辑实现，包括机器内部数据流和控制流的组成以及逻辑设计等。其目标是合理地把各种部件、设备组成计算机，以实现特定的系统结构，同时满足所希望达到的性能价格比。一般而言，计算机组成研究的范围包括：确定数据通路的宽度、确定各种操作对功能部件的共享程度、确定专用的功能部件、确定功能部件的并行度、设计缓冲和排队策略、设计控制机构和确定采用何种可靠技术等。计算机组成的物理实现。包括处理机、主存等部件的物理结构，器件的集成度和速度，器件、模块、插件、底板的划分与连接，专用器件的设计，信号传输技术，电源、冷却及装配等技术以及相关的制造工艺和技术。主要研究内容 1·机内数据表示：硬件能直接辨识和操作的数据类型和格式 2·寻址方式：最小可寻址单位、寻址方式的种类、地址运算 3·寄存器组织：操作寄存器、变址寄存器、控制寄存器及专用寄存器的定义、数量和使用规则 4·指令系统：机器指令的操作类型、格式、指令间排序和控制机构 5·存储系统：最小编址单位、编址方式、主存容量、最大可编址空间 6·中断机构：中断类型、中断级别，以及中断响应方式等

计算机系统结构有详细答案

(仅供参考，不作为考试标准)，选择题分，每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员。意________，应当注提系在计算机统设计时，为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法象联组，相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路令指条下析分后推C) 令指条下行执后推D) 流的用采，时关据数到，中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通，测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码经多级网络串联来实现全排列网络，只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

计算机体系结构论文

计算机体系结构论文论文题目：计算机系统结构中多处理机技术姓名：XXX 班级：XXX 学号：XXXX

摘要：多处理机是指能同时执行多个进程的计算机系统.多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理，协同求解一个大而复杂的问题来提高速度，或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构，以及现今几种典型的并行计算机体系结构及处理机分配与调度策略。而本篇论文主要根据所阅读的文章进行扩展延伸，主要介绍了多处理机技术，它的总线以及分配调度方面。关键字：多处理机；体系结构；总线；调度引言：微电子技术和封装技术的进步，使得高性能的VLSI微处理器得以大批量生产，性能价格比不断合理，这为并行多处理机的发展奠定了重要的物质基础。计算机系统性能增长的根本因素有两个：一个是微电子技术，另一个是计算机体系结构技术。五十年代以来，人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等_系列并行处理技术，提高计算机处理速度，增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容，已成为并行计算机发展中人们最关注的结构。多处理机的介绍：多处理机是指能同时执行多个进程的计算机系统。由于超大规模集成电路(VLSI)技术迅速发展的结果，多处理技术能够充分地发挥高性能的32位微处理机的有效性，用大量低价格的部件配置高性能的计算机结构系统.以典型的

计算机体系结构知识点

目录第一章计算机系统结构基本概念 (2) (一) 概念 (2) (二) 定量分析技术 (3) (三) 计算机系统结构发展 (4) (四) 计算机的并行性 (5) 第二章计算机指令集结构 (7) 一. 指令集结构的分类 (7) 二. 寻址方式 (7) 三. 指令集结构的功能设计 (8) 四. 指令格式的设计 (10) 五. MIPS指令集结构 (10) 第三章流水线技术 (14) 一. 流水线的基本概念 (14) 二. 流水线的性能指标 (14) 三. 流水线的相关与冲突 (16) 四. 流水线的实现 (18) 第四章指令集并行 (18) 付志强

第一章计算机系统结构基本概念 (一)概念什么是计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性. 透明性:在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念成为透明性. 常见计算机系统结构分类法冯氏分类法(冯泽云):按最大并行度对计算机进行分类. Flynn分类法:按指令流和数据流多倍性进行分类 ①单指令流单数据流 ②单指令流多数据流 ③多指令流单数据流(不存在) ④多指令流多数据流付志强

(二)定量分析技术 Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比. 加速比=系统性能改进后系统性能改进前 = 总执行时间改进前总执行时间改进后加速比依赖于以下两个因素 ①可改进比例 ②部件加速比 CPU性能公式 CPU时间 CPU时间=执行程序所需时间的时钟周期数x时钟周期时间(系统频率倒数) CPI(Cycles Per Instruction) CPI =执行程序所需时钟周期数/所执行指令条数 ∴CPU时间= IC x CPI x 时钟周期时间可知CPU性能取决于一下三个方面 ①时钟周期时间:取决于硬件实现技术和计算机组成付志强

计算机体系结构参考1

第一题选择题 1．SIMD是指（B） A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2．下列那种存储设备不需要编址？D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3．按照计算机系统层次结构，算术运算、逻辑运算和移位等指令应属于（A）级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4．早期的计算机系统只有定点数据表示，因此硬件结构可以很简单。但是这样的系统有明显的缺点，下面哪一个不是它的缺点：B A．数据表示范围小 B．单个需要的计算时钟周期多 C．编程困难 D．存储单元的利用率很低 7．下面哪个页面替换算法实际上是不能够实现的？D A）随机页面替换算法 B）先进先出替换算法 C）最久没有使用算法 D）最优替换算法

9．指令优化编码方法，就编码的效率来讲，那种方法最好？C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10．在早期冯·诺依曼计算机特征中，机器以（C）为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A．先进先出顺序访问 B．按地址访问 C．无地址访问 D．按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段，每—段分别只有—个部件可供使用，并且执行时间分别为Δt、2Δt和3Δt，连续执行n条指令所需要花费的最短时间约为( C )。（假设“取指令”、“分析”和“执行”可重叠，并假设n足够大） A．6 nΔt B．2 nΔt C．3 nΔt D．nΔt 6、下列计算机不属于RISC计算机的是（C ）。 A．SUN：Ultra SPARC

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。

解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。

计算机测试系统发展综述

计算机测试系统发展综述来源：牌技研究中心 https://www.360docs.net/doc/9715074337.html, 摘要: 计算机测试系统通常作为设备或武器系统的一个不可缺少的组成部分,其测试性能是衡量设备或武器系统优劣的一项重要指标。其应为基于标准总线的、模块化的开放式体系结构且具备虚拟仪器特点。通过分析和比较VXI总线和PXI总线特点,给出了计算机测试系统的发展方向。归纳出了计算机测试系统应具备的9个方面功能。给出了设计和研制计算机测试系统应遵循的基本原则。关键词: 测试系统;VXI总线; PXI总线测试技术涉及到众多学科专业领域,如传感器、数据采集、信息处理、标准总线、计算机硬件和软件、通信等等。测试技术与科学研究、工程实践密切相关,两者相辅相成,科学技术的发展促进了测试技术的发展,测试技术的发展反过来又促进了科学技术的进步。测试仪器发展至今,大体经历了5 代: 模拟仪器、分立元件式仪器、数字化仪器、智能仪器和虚拟仪器。自上个世纪80年代以来,伴随微电子技术和计算机技术飞速发展,测试技术与计算机技术的融合已引起测试领域一场新的革命。1986 年美国国家仪器公司提出“虚拟仪器”即“软件就是仪器”的概念。虚拟仪器是卡式仪器的进一步发展,是计算机技术应用于仪器领域而产生的一种新的仪器类型,它以标准总线作为测试仪器和系统的基本结构框架,配置测量模块,通过软件编程实现强大的测量功能。在虚拟仪器系统中,用灵活、强大的计算机软件代替传统仪器的某些硬件,用人的智力资源代替物质资源,特别是系统中应用计算机直接参与测试信号的产生和测量特征的解析,使仪

器中的一些硬件、甚至整件仪器从系统中“消失”,而由计算机的硬软件资源来完成它们的功能。另外,通过软件可产生许多物理设备难以产生的激励信号以检测并处理许多以前难以捕捉的信号。虚拟仪器是计算机技术和测试技术相结合的产物,是传统测试仪器与测试系统观念的一次巨大变革。测试技术和设备涉及国民经济和国防建设的各行各业,先进的电子测试设备在众多行业的科研、生产和设备维护使用过程中起着举足轻重的作用。特别是在电子产品、航空航天、武器装备、工业自动化、通信、能源等诸多领域,只要稍微复杂一点的涉及到弱电的系统(或装置)都要考虑测试问题。测试系统是设备或装备的一个必不可少的组成部分,如武器系统的维护维修离不开测试设备。一个系统(或装置)测试功能的完备与否已成为衡量其设计是否合理和能否正常运行的关键因素之一。测试仪器和系统在国民经济和国防建设中起着把关和指导者的作用,它们广泛应用于炼油、化工、冶金、电力、电子、轻工和国防科研等行业。测试仪器和系统从生产现场各个环节获得各种数据,进行处理、分析和综合,通过各种手段或控制装置使生产环节得到优化,进而保证和提高产品质量。在武器系统科研试验现场,测试仪器和系统可获得试验中各个阶段和最终试验数据,用于及时发现试验中出现的问题和给出试验结论,并为后续相关试验提供依据。因此,测试仪器与系统对于提高科研和试验效率,加快武器试验进程和保证试验安全至关重要。以雷达、综合电子战为代表的军事电子领域,以预警机、战斗机、卫星通信、载人航天和探月工程为代表的航空、航天领域及以导弹武器系统为代表的兵器领域等都离不开测试设备,它是这些装备和系统正常使用和日常维护及维修所必备的。 1 系统类型现代的测试系统主要是计算机化系统,它是计算机技术与测量技术深层次结合的产物。随着计算机技术的发展,构成测试系统的可选择性不断加大,按照测试功能要求,可构成多种类型的计算机测试系统。在计算机测试系统分类问题上并没有严格的统

计算机体系结构试题汇总

计算机系统结构姓名：学号：一、简答题（每小题10分，共20分） 1．简述使用物理地址进行DMA存在的问题，及其解决办法。 2．从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较（列表）。二、（60分）现有如下表达式： Y＝a ×X 其中：X和Y是两个有64个元素的32位的整数的向量，a为32位的整数。假设在存储器中，X和Y的起始地址分别为1000和5000，a的起始地址为6000。 1．请写出实现该表达式的MIPS代码。 2．假设指令的平均执行时钟周期数为5，计算机的主频为500 MHz，请计算上述MIPS 代码（非流水化实现）的执行时间。 3．将上述MIPS代码在MIPS流水线上（有正常的定向路径、分支指令在译码段被解析出来）执行，请以最快执行方式调度该MIPS指令序列。注意：可以改变操作数，但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图，计算调度前和调度后的MIPS代码序列执行所需的时钟周期数，以及调度前后的MIPS流水线执行的加速比。 4．根据3的结果说明流水线相关对CPU性能的影响。三、（20分）请分析I/O对于性能的影响有多大？假设： 1．I/O操作按照页面方式进行，每页大小为16 KB，Cache块大小为64 B；且对应新页的地址不在Cache中；而CPU不访问新调入页面中的任何数据。 2．Cache中95%被替换的块将再次被读取，并引起一次失效；Cache使用写回方法，平均50%的块被修改过；I/O系统缓冲能够存储一个完整的Cache块。 3．访问或失效在所有Cache块中均匀分布；在CPU和I/O之间，没有其他访问Cache 的干扰；无I/O时，每1百万个时钟周期中，有15,000次失效；失效开销是30个时钟周期。如果替换块被修改过，则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

软件体系结构综述

软件体系结构研究综述班级：软件092 学号：17 姓名：陈世华摘要: 近年来,软件体系结构逐渐成为软件工程领域的研究热点以及大型软件系统与软件产品线开发中的关键技术之一.归纳了软件体系结构技术发展过程及其主要研究方向.在分析了典型的软件体系结构概念之后,给出了软件体系结构的定义.通过总结软件体系结构领域的若干研究活动,提出了软件体系结构研究的两大思路,并从7个方面介绍了软件体系结构研究进展.探讨了软件体系结构研究中的不足之处,并分析其原因.作为总结,给出了软件体系结构领域最有前途的发展趋势. 关键词: 软件体系结构;基于体系结构的软件开发;软件体系结构描述语言;软件体系结构描述方法;软件体系结构演化;软件体系结构发现;软件体系结构分析;软件体系结构验证;特定域软件体系结构(DSSA) Abstract: Software architecture (SA) is emerging as one of the primary research areas in software engineering recently and one of the key technologies to the development of large-scale software-intensive system and software product line system. The history and the major direction of SA are summarized, and the concept of SA is brought up based on analyzing and comparing the several classical definitions about SA. Based on summing up the activities about SA, two categories of study about SA are extracted out, and the advancements of researches on SA are subsequently introduced from seven aspects. Additionally, some disadvantages of study on SA are discussed, and the causes are explained at the same time. Finally, it is concluded with some significantly promising tendency about research on SA. Key words: software architecture; architecture-based development; architecture description language; architectural representation and description; architectural evolution and reuse; architectural discovery; architectural analysis; architectural verification and evaluation; domain-specific software architecture (DSSA)

计算机体系结构重点总结

1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。 F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间整个任务在老计算机上运行得时间同时将S定义为先进高速部件与老部件得性能,则 S= 老部件完成该功能得时间先进高速部件完成该功能得时间而采用了高速部件后整机性能提高比,即 Speedup = T old = 1 T new (1－F)+F/S 某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。根据Amdahl定律计算: ⑴采用增强技术后计算机性能加速比就是多少？ ⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。 2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。 (2)时间局部性:如果某一参数被引用,那它不久将再次被引用。这里指出了程序执行时在时间上得局部性 (3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。指出程序执行时地址空间上得局部性。 3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。完成同样任务所需得时间越短,计算机得性能越好。(考判断) 4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。 5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。(考判断) 6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。提高计算机性能就就是提高CPU性能与减少等待时间。 cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction), CPI=CPU花费得时钟数/CPU执行得总指令数 CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ 8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空) CPU性能 =1/CPU time= f / ( I×CPI ) 计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。 MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 ) MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×106 10、工作负载基准程序(workload benchmark): (1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空) 11、基准程序得一般设计原则: (1)具有代表性,反映用户得实际应用。 (2)不能对基准程序进行优化。 (3)复现性。能重复测试,其环境相同,结果能重复出现。(4)可移植性。系统相关性要小。 (5)紧凑性。基准程序不宜太庞大。 (6)成本-效率要高。 12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序 13、指令设计时主要以下几个方面来考虑: (考填空) ⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。

计算机系统结构论文

计算机系统结构论文计算机系统结构中多处理机技术摘要：多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理，协同求解一个大而复杂的问题来提高速度，或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构。关键词：多处理机；体系结构；总线微电子技术和封装技术的进步，使得高性能的VLSI 微处理器得以大批量生产，性能价格比不断合理，这为并行多处理机的发展奠定了重要的物质基础。计算机系统性能增长的根本因素有两个：一是微电子技术，另一个是计算机体系结构技术。五十年代以来，人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等一系列并行处理技术，提高计算机处理速度，增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容，已成为并行计算机发展中人们最关注的结构。

1 微处理器的发展 20 世纪80 年代中期，RISC 精简指令集计算机，用20%指令的组合实现了CISC 计算机指令系统不常用的80%指令的功能。在提高性能方面，RISC 采用了超级流水线、超级标量、超长指令字并行处理结构；多级指令Cache；编译优化等技术，充分利用RISC 的内部资源，发挥其内部操作的并行性，从而提高流水线的执行效率。20 世纪80 年代后期，RISC 处理机的性能指标几乎以每年翻一番的速度发展，它对于提高计算机系统的性能和应用水平起着巨大的作用。目前，由Intel 和HP 两家公司联合开发的基于IA—64 架构的Merced 芯片，并由其共同定义的显式并行指令计算技术EPIC(Explicitly Parallel Instruction Computing )，将为微处理器技术的发展带来突破性进展。EPIC 技术主要指编译器在微处理器执行指令之前就对整个程序的代码作出优化安排，编译器分析指令间的依赖关系，将没有依赖关系的指令(最多3 个)组成一“组”，由Merced内置的执行单元读入被分成组的指令群并执行。从理论上讲，EPIC 可以并行执行3 倍于执行单元数的指令。64 位体系结构的Merced 芯片还采用了指令预测、数据预装等技术，可以显著地减少实际执行程序的长度，同时增强语句执行的并行性，经过代码的重组，程序的执行时间比基于传统体系结构

-计算机系统结构(有详细答案)

(仅供参考，不作为考试标准)，选择题(30分，每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员在计算机系统设计时，为了提高系统性能，应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法与全相联映象相比，组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令流水操作中，遇到数据相关时，采用的解决办法有________。 A)用优化编译器检测，通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码经多级网络串联来实现全排列网络，只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络虫蚀寻径以流水方式在各寻径器是顺序传送的是________。授课：XXX

计算机体系结构名词解释总汇

集中式共享存储器结构（centralized shared memory architecture）：这类多处理机在目前至多有几十个处理器，可通过大容量的cache和总线互连使各处理器共享一个单独的集中式存储器。物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址，每个处理器可以访问任何一个其他的局部存储器。这类机器的结构被称为分布式共享存储器（DSM，distributed shared memory）或可缩放共享存储器（SSM，scalable shared memory）体系结构。整个地址空间由多个独立的地址空间构成，它们在逻辑上也是独立的，远程的处理器不能对其直接寻址。在这种机器的不同处理器中，相同的物理地址指向不同存储器的不同单元，每一个处理器、存储器模块实际上是一个单独的计算机，因而这种机器也称为多计算机（multicomputers）。通讯延迟：发送开销＋跨越时间＋传输延迟＋接收开销。迁移是把远程的共享数据项的拷贝放在一个本处理器局部的cache中使用，从而可降低对远程共享数据的访问延迟。复制是把多个处理器需要同时读取的共享数据项的拷贝放在各自局部cache中使用，复制不仅降低了访存的延迟，也减少了访问共享数据时的产生的冲突。目录（directory）：物理存储器中用来保存共享数据块的状态及相关信息的数据结构。监听（snooping）：每个cache除了包含物理存储器中块的数据拷贝外，也保存着各个块的共享状态信息。Cache通常连在共享存储器的总线上，各个cache控制器通过监听总线来判断它们是否有总线请求的数据块。在一个处理器写某个数据项之前保证它对此数据项有唯一的访问权，对应这种方法的协议称为写作废（write invalidate）协议。cache块拥有唯一的拷贝的处理器通常称为这个cache 块的拥有者（ower）。处理器的写操作使其成为对应cache块的拥有者。原子性（atomic），即操作运行过程中不能被打断，例如将写失效的检测、申请总线连接、接收响应作为一个单独的原子操作。基于目录的相关性协议称为全映射（full map）。原子交换（atomic change）：将一个存储单元的值和一个寄存器的值进行交换。建立一个锁，锁值为0表示开锁，为1表示上锁。旋转锁是指处理器环绕一个锁不停地旋转而试图获得该锁。栅栏（barrier）同步：是一个同步操作，它强制所有到达该栅栏的进程进行等待，直到全部的进程到达栅栏，然后释放全部的进程，从而形成同步。组合树是多个请求在局部结合起来形成树的一种分级结构，它降低冲突的原因是将大冲突化解成为并行的多个小冲突。排队记录等待的进程，当锁释放时送出一个已确定的等待进程，这种机制称为排队锁（queuing lock）。一个处理器对变量的写和另一个处理器对该变量的访问（读或写）由一对同步操作分开，其中一个在写操作后执行，另一个在别的处理机访问之前执行，则称数据访问有序。无同步操作排序变量可能提前被刷新，这种情况称为数据竞争（data race），从而对于同步的程序可称之为无数据竞争（data－race－free）。称与解锁相对应的同步操作为释放（release）与加锁相对应的则称为获取（acquire）。防护（fence）是计算过程中的固定点，用来保证无读或写穿过防护点。预取能返回最新数据值，并且保证对数据实际的存储器访问返回的是最新的数据项，则被称为非绑定的（nonbinding）。互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络，这些结点可能是处理器、存储模块或其它设备，它们通过互连网络进行信息交换。静态网络由点和点直接相连而成，这种连接方式在程序执行过程中不会改变。动态网络是用开关通道实现的，它可动态地改变结构，使其与用户程序中通信要求匹配。

计算机系统结构复习题分析

计算机系统结构复习

1从使用语言角度，可将系统按功能划分为多层次机器级结构，层次结构分别是：应用语 _________ 言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序序机器级。 2、各机器级的实现主要靠翻译和解释或两者结合进行。翻译是先用转_________ 级上的程序整个地变换成低一级机器级上等效的程序，然后再在低一级机器级上实现的技__________ 术。解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功—能，是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。 3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。 4、计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定，提供机器语言、汇编语言程序设计或编译程序生成系统为使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。 5、计算机系统结构的属性包括：数据_________ 组织、中断机构、系统机器级的管态和用户态的定义和切换、机器级的I/O结构、系统各部分的信息保护方式和保护机构等属性。 6、机器透明性：指相对于每一机器级设计人员，都客观存在的功能或属性看不到的现象，称相对于此级设计人员来说，这此功能或属性是具有透明性，即透明的。 7、计算机组成指的是计算机系统结构的逻辑实现，包括机器级内部的数据流和控制流的组成以及逻辑设计等。它着眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。 8计算机组成设计要解决的问题是在所______________________________________________________ 各种设备各部件组织成计算机，来实现所确定的系统结构。 9、当前，计算机组成设计主要是围绕_________ 功能的分散和设置专用功能部件来进行的。 10、计算机组成设计要确定的方面一般应包括：数据通路宽路、专用部件的设置、各种操作对部件的共享程度、功能部件的并行度、控制机构的组成方式、缓冲和排队技术、预估预判技术、可靠性技术等。 11、计算机实现指计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，器件、模块、插件、底板的划分与连接，专用器件的设计，微组装技术，信号传输，电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术，其中，器件技术在实现技术中起着主导作用。 12、计算机系统结构设计的任务是进行软、硬件的功能分配，确定传统机器级的软、硬件界面。 13、软、硬件取舍的三个基本原则是：第一个基本原则是应考虑在现有硬、器件（主要是逻辑器件和存储器）条件，系统要有高的性能价格比，主要从实现费用、速度和其他性能要求来综合考虑。第二个基本原则是要考虑到准备采用和可能采用的组成技术，使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。第三个基本原则是从"软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持放在首位。 14、程序运行的时间应该是衡量机器时间（速度）性能最可靠的标准。 15、计算机性能诵常用峰值性能及持续性能来评价。峰值性能是指在理想情况下计算机系统可获得的最高理论性能值，它不能反映出系统的实际性能。 16、持续性能的表示有算术性能平均值、调和性能平均值和几何性能平均值三种。 17、算术性能平均是通常对系统执行时间评价；调和性能平均值反映运行全部程序所需的时

计算机体系结构的基本概念

第一章计算机体系结构的基本概念 1、20世纪50年代，人们认为在银行里用计算机来完成现金存取业务的想法三荒唐可笑的。 2、填空题：计算机的发展始终受到制造技术和计算机体系结构技术的双重影响。 3、目前广泛使用的存储程序计算机的完整概念就是在这个时期产生的，人们通常称之为冯.诺依曼计算机结构。 3、微处理器出现以后，计算机系统设计、计算机市场和计算机应用都出现了较大的变化。首先，计算机用户是最直接的收益者。第二，对于市场而言，微处理器的大批量生产促成了计算机产品的批量化、标准化、和市场化，这种变化也促进了计算机设计、生产和应用的良性发展。第三、大量兼容的微处理器、标准化的接口、高度兼容的计算机系统的出现，避免了系统程序和应用程序的重复开发。 4、经典的关于“计算机体系结构”的定义三 1964年C.M.Amdahl在介绍IBM360系统时提出的，其具体描叙为“计算机体系结构是程序员所看到的计算机的属性，即概念性

结构与功能特性”。 5、Amdahi提出的体系结构是指机器语言程序级程序员所看见的计算机属性。 6、经典计算机体系结构概念的实际是计算机系统中软、硬件界面的确定，也就是指令集的设计，该界面之上由软件的功能实现，界面之下由硬件和固定的功能来实现。 7、系列机的软件兼容还有向上兼容、向下兼容、向前兼容、向后兼容之分。 8、现代计算机实现技术的基础核心是以晶体管为基本单元的平面集成电路。 9、集成电路密度大约每两年翻一番。 10、集成电路制造中的重要技术指标之一是特征尺寸，在现有集成电路制造工艺中，它是指集成电路上一个晶体管的尺寸或者x 和y两个维度上的最大制造线宽。 11、用户关心的是响应时间：从事件开始到结束之间的时间，也称为执行时间。管理员关心的是如何提高流量：在单位时间内所能完成的工作量。它们的相同点是都认为能够以最短时间完成指定任务的计算机就是最快的；这两者之间的不同点是响应时间通常针对单任务，而流量往往针对多任务。