计算机体系结构总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机体系结构重点
1并行线索:时间,空间的并行
并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作
2、资源重复,时间重叠,资源共享
资源重复:通过重复设置硬件资源,大幅度提高计算机系统的性能。(多处理机系统)
时间重叠:多个处理过程在时间上相互错开,轮流、重叠地使用同一套硬件设备的各个部分。(流水线)
资源共享:软件方法,使多个任务按一定时间顺序轮流使用同一套硬件设备。(多道程序、分时系统)
3、数据并行:字、位
(1)流水线的指令并行
(2)超流水线:细分时间
(3)超标量流水线:重复设置流水线
(4)向量机:流水线,数据并行
(5)提高cache命中率
(6)多机系统,线程级并行(CMP )
4、局部性
(1)存储系统原理
(2)提高cache命中率(victim cache,伪相联cache)
(3)cache有好程序(空间、时间局部性)
有些去年的题都没有被老师的提纲点出来,崩溃了。。。。
蓝色的没查到,晕了。。。。
红色的太庞大,懒了。。。。
------- 卖萌了by备
(分章解读)
一、概论
1计算机体系结构与组成原理,实现的关系,基本概念(兼容、模拟、仿真)层次:微程序语言、机器语言、(操作系统虚拟机)、<-解释的方法实现
--------- 用翻译的方法实现->汇编语言、高级语言、应用语言
硬件逻辑优点:速度快
虚拟机:由软件实现的机器,以区别于由硬件/固件实现的物理机器
计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性计算机组成:计算机系统结构的逻辑实现,包含物理机器中的数据通道和控制信号的组成以及逻辑设计等。计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
计算机系统机构的研究对象:计算物理系统的抽象和定义;具体包括:
数据表示;寻址方式;寄存器定义;指令系统;存储结构;中断系统;机器工作状态定义和切换;I/O系统; 总线结构;系统安全与保密;
结构、组成和实现三者关系:
结构是计算机系统的软、硬件界面;
组成是计算机系统结构的逻辑实现;实现是九三级组成的物理实现;
软件兼容:同一个软件可以不加修改地运行于系统结构相同的各个机器上,而且所得结果一致;向上(下)兼容:低(高)档机器的目标程序不加修改就可以运行于高(低)档机器。一般向上兼容。前后兼容:指按系列机投放市场先后,实现软件兼容。一般向后兼容。
模拟:用机器语言解释实现程序移植的方法; (用机器语言,程序在主存储器)
仿真:直接用微程序去解释另一种机器的指令系统;
(用微程序,程序在微程序存储器)
1
2、Amdahl (定律加速比公式)
S=-
j f Fi 、 (1-迟 F M IFL |
Fi :可改进比例 Si :部件加速比 应用见大题; 3、计算机体系结构设计的主要方法(三个方面。软硬件平衡) (1) 确定用户对计算机系统的功能、价格和性能要求 (2) 软、硬件平衡:性价比与实现的难易程度 (3) 系统结构设计应符合今后发展方向 IC*CPI 时钟频率,CPI ,平均CPI ,MIPS ) 5、 冯诺依曼计算机(顺序执行(串行执行) ,程序存储,集中控制,以 ALU 为核心)控制流计算机 ⑴以ALU 为中心 (2) 在存储器中,指令和数据同等对待 (3) 存储器是按地址访问、按顺序线性编址的一维结构,每个存储单元的位数是固定的 (4) 指令是顺序执行的 (5) 指令由操作码和地址码组成 (6) 指令和数据均以二进制编码表示,采用二进制运算 6、 体系结构分类方法(Flynn 分类法:指令流,数据流,多倍性) Flynn :按指令流和数据流的多倍性进行分类。 指令流:机器执行的指令序列 数据流:由指令流调用的数据序列 多倍性:在系统受限的部件上,同时处于同一执行阶段的指令或数据的最大数目 SISD (单指令流单数据流(缩写)):传统的顺序处理计算机、标量流水线处理机 SIMD :阵列处理机、向量流水线处理机、相联处理机 MISD : 无 MIMD :大多数多处理机和多计算机系统; (处理机之间相互作用程度高,紧密耦合) 7、 非冯诺依曼计算机(数据流驱动、需求驱动) 二、流水线(并行概念) 1流水线基本概念(如何实现并行、多个取指、分析、执行部件) (1) 流水线:加快指令的解释过程,提高指令的并行性 (2) 如何实现:(重叠技术) 取指分析子过程在指令分析器里完成,执行子过程在执行部件实现。这两个部件是独立的。如果分析子 过程所需时间=执行子过程所需时间(分析周期 =执行周期),那么执行部件里处理第 n 条指令的执行子 过程时,分析器里处理的是第 n+1条指令的分析子过程。 2、先行控制技术(预处理、缓冲),锁存技术 4、计算机体系结构的评价标准( CPU 时间 CPI : n CPI 八(CPI i * i 1 (IC :指令数; CPI :每条指令周期) (1)先行控制技术:缓冲+预处理技术结合;通过对指令流和数据流的先行控制,尽量使指令分析部件和执行部件处于忙碌状态。 (2)缓冲技术:在工作速度不固定的两个功能部件之间设置缓冲器,用以平滑他们的工作(3)预处理技术:预取指令、对指令进行加工以及预取操作数等。 3、指令并行的空间并行和时间并行性:时空图*****主要见大题 时钟周期 \ 指令 123456789 指令k IF ID EX MEM WB 指令k+1IF ID EX MEM WB 指令k+2IF ID EX MEM WB 指令k+3IF ID EX MEM WB 指令k+4IF ID EX MEM WB 指令周期取处存处修改 IF (取指令周期)存储器指令寄存器IR PC+=4 ID (指令译码/读寄存器周期)IR寄存器编号、通用寄存器组读出操作数 EX (执行/有效地址计算周期)--- MEM (存储器访问/分支完成周期)存储器(load指令)(store指令)存储单元PC (分支指令)WB (写回周期)通用寄存器组 IF-MEM可能冲突 ID-WB可能冲突 4、线性流水线(动静态)的性能分析(加速比、吞吐率、效率、瓶颈) (1)静态流水线:在同一时间段内,多功能流水线中的各段只能按同一种功能的连接方式工作 (2)动态流水线: -------------------------------------- 可以按照不同的方式连接,同时执行多种功能 (3)线性流水线:流水线的各段串行连接,没有反馈回路 (4)非线性流水线: --------------------- ,还有反馈回路 (5)吞吐率(TP ):单位时间内流水线所完成的任务数量或输出结果的数量 实际吞吐率:TP二n(厶t j为最慢的一段时 间) a 兀(n— 1)':t j (6)加速比(S):完成同样一批任务,不用流水线所用时间与使用之比 m n •为如 实际加速比:S二------- U(厶.为最慢的一段时间 '•弋(n—1)'t j i * (7)效率(E):流水线中的设备实际使用时间与整个运行时间的比 TP n(任务数) Tk(完成n个任务所用时 1 _______ max( U , %) nk k n -1 (流水线各段时间相等) S max nk 二lim ------- 二k n r k n T (流水线各段时间相等)