浙江工商大学-计算机体系结构-第1章 计算机体系结构概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.9 计算机设计的量化原则
关注四个方面的内容:并行性、局部性原理、 经常性事件和Amdahl定律
采用并行性 采用并行性是改善计算机性能的一种 重要方法,如指令级并行、线程级并行以及数 字设计层面上的并行性等
局部性原理 程序经常会重复使用它最近使用过的 指令和数据,有两种类型,分别为时间局部性 原理和空间局部性原理
类似的例子见P28
1.9 计算机设计的量化原则
处理器性能公式
一个程序的CPU时间度量公式: CPU时间=一个程序的CPU时钟周期数*时钟周期长度
或者
CPU时间=一个程序的CPU时钟周期数/时钟频率
1.9 计算机设计的量化原则
处理器性能
指令平均时钟周期(CPI,Clock cycles Per Instruction) 指令路径长度或指令数(IC , Instruction Count)
1.1 简介
自2002年始,性能增长率降到每年20%的 水平(P2 图1.1) 原因:1)风冷芯片的最大功耗 2)指令级并行发掘近极限 3)存储器时延无法再降低
1.1 简介
本课程特色 主要从系统结构的角度和编译器的改进方面 来定量分析计算机系统性能在20世纪快速增 长的原因,此外,还关注面临的挑战及潜在 的方法和技术。
1.3 计算机系统结构定义
5)操作指令(P7 图1.5) 操作指令分为数据传输指令、算术逻辑运算指令、控 制指令以及浮点数操作指令,无互锁流水级微处理器( MIPS)代表了2006年流行是RISC系统结构,是一种 简单且易于实现流水的指令集系统结构。 6)控制流指令 支持条件转移指令、无条件跳转指令、程序调用和返回 指令 7)ISA的编码 分固定长度和可变长度两种类型,所有的MIPS指令都 是32位长度的,简化了指令的译码
计算机体系结构
第1章 计算机设计基本原理
1.1 简介 计算机技术在近60年时间内性能飞速发展 前25年: 以 25%/年 速度增长 70年代末:以35%/年 速度增长 80年代初:精简指令集计算机(RISC)出现, 使得计算机性能每年以超过50%速度 增长。
1.1 简介
RISC(Ruduced Instruction Set Computer) 诞生于80年代初期,关注两种关键的实现 技术:指令级并行和Cache的使用 指令级并行:流水线多发射指令 Cache:高速缓存,简单组织复杂结构及优 化
1.6 成本的发展趋势
例子:直径为30cm 晶圆上有多少边长为 1.5cm的晶片?
以上仅仅给出每个晶圆上可以容纳的晶片的最大 数目,关键问题是每个晶圆上合格晶片的比率 如何计算?
1.6 成本的发展趋势
晶片的成品率
假设有缺陷的产品在晶片中随机分布且成品率与 制造过程的复杂度成反比,则有以下经验公式
1.5 集成电路功耗的发展趋势
例子:目前一些微处理器采用可调整电压技 术,当电压下降15%时,频率也会下降 15Fra Baidu bibliotek,这对动态功率有何影响?
由于电容不变,电压的平方和频率之比为:
动态功率比原来减少40%的功率 思考静态功率?
1.6 成本的发展趋势
成本问题比较复杂,教科书中往往忽略性 价比中的成本因素,但当设计者想增加某 一功能特性时,必须考虑成本因素,这里 我们主要考虑集成电路的成本
1.2 计算机的分类
嵌入式计算机
增长最快,智能设备随处可见,其处理能力和价格覆 盖范围很广。 嵌入式应用的特点 : 1)实时性 如数字机顶盒,视频帧处理时间必须有限 2)最小化存储器需求 涉及到代码量大小问题 3)最小化功耗需求 优化功耗同样重要
1.3 计算机系统结构定义
定义
早期的计算机系统结构通常是指指令系统设 计,计算机设计的其他方面则称为实现 这种定义忽视了计算机实现技术面临的挑战 回顾:指令集系统结构
1.5 集成电路功耗的发展趋势
器件升级会对功耗产生影响 动态功率:主要能耗来自开关晶体管
动态功率计算:与电容电压频率有关
移动设备关注电池寿命,用能量单位度量:
1.5 集成电路功耗的发展趋势
电压降低:可以在很大程度上减少动态功率 和能耗,在过去的20年中,电压从5V降 低到接近1V的水平。
电容性负载:由连接到输出的晶体管数目以 及决定电线和晶体管电容的实现技术确定
1.6 成本的发展趋势
集成电路的成本
集成电路的成本是影响计算机总成本的重要因 素,分析整机的成本就必须先研究芯片的成本 硅晶片生产程序:先对一个晶圆进行测试,然后 把晶圆切割为晶片,再对每个晶片进行封装
1.6 成本的发展趋势
成本计算公式
集成电路成本=(晶片成本+晶片测试成本+封装成本) /最终成品数目 晶片成本=晶圆成本/(每片晶圆的晶片数*晶片成品率)
1.9 计算机设计的量化原则
关注经常性事件 计算机设计中最广泛的准则是提 高经常性事件的执行速度,就是说,在设计时 必须优先考虑经常性事件;此外,经常出现的 情况比不经常出现的情况要简单一些,因而提 高性能相对容易
Amdahl定律 该定律是对“关注经常性事件”原 则进行量化。Amdahl定律描述为:通过使用 某种较快的执行方式所获得的性能提高,受限 于可使用这种较快执行方式的时间所占的比例
1.4 实现技术的发展趋势
以下四种实现技术对计算机的发展最为重要: 1)集成电路技术 晶体管密度以每年35%的速度增长,四年翻两番,芯 片尺寸每年增长15%左右,使得每个芯片上晶体管数 目以每年50%左右速度增加。 2)DRAM(动态随机存取存储器) 容量每年增长40%,每两年翻一番 3)磁盘技术 1990年以前,每三年翻一番,此后提高到每年60% ,2004年以后又回落到每年30%
从模块可用直至发生故障时的持续服务实现,平均故 障时间(MTTF , Mean Time To Failure)是一个可 靠性度量方法;服务中断以平均修复时间(MTTR , Mean Time To Repair)来度量
模块可用性
是对于在完成和中断两个状态间变迁所完成的服务度量
1.7 可靠性
例子:假设一个磁盘系统有如下组件和MTTF: 1)10个磁盘,每一个是1000000小时的MTTF 2) 1个SCSI控制器,500000小时的MTTF 3) 1个电源,200000小时的MTTF 4) 1个风扇,200000小时的MTTF 5) 1条SCSI电缆,1000000小时的MTTF 试计算该磁盘系统的MTTF
参考P31例子
谬误和易犯的错误
易犯的错误 忽视Amdahl定律
花巨大精力优化,发现整体性能提升微乎其微
谬误 处理器的成本在系统成本中占支配地位
处理器成本并不具有支配地位,在大规模服务器中,处 理器成本只占20%,在PC服务器中更是不到10%
谬误 基准测试程序永远有效
有些因素会影响基准测试程序的有效性,对测试程序有 效性影响很大的是测试程序防“破解”的能力
1.8 计算机性能测量
评价计算机性能的指标:响应时间和吞吐量
计算机用户关心的是如何减小响应时间,而大型数据处理 中心的管理员关心的是如何增大吞吐量
基准测试程序
测试性能最好用包含真实应用基准测试程序,如编译器 等,运行比实际应用简单的程序来评价性能缺乏说服力
基准测试程序集
包括桌面基准测试程序和服务器基准测试程序
CPI=一个程序的CPU时钟周期数/该程序的指令数 CPU时间=指令数*CPI*时钟周期
结论:处理器性能与三个因素有关,程序的指令数 、每条指令执行所需要的时钟周期数和时钟周 期长度,这三个因素对CPU时间影响是相同的
1.9 计算机设计的量化原则
处理器性能
指令数:由指令集系统结构和编译器技术决定 CPI:由计算机组成和指令系统结构决定 时钟周期:由硬件技术和计算机组成决定 总的处理器时钟周期数:
加速比计算公式:
1.9 计算机设计的量化原则
例子:分析一个用于Web服务器系统处理器的性能。假定 采用以下的增强方式,新的处理器处理Web服务器应 用程序的运行速度是原来处理器的10倍,假定此处理 器有40%的时间用于计算,另外60%的时间用于I/O 操作,那么增强后的总加速比是多少?
增强比例=0.4,增强加速比=10,
1.9 计算机设计的量化原则
Amdahl定律定义了采用某种增强措施所取得的加 速比,加速比定义如下:
或者
1.9 计算机设计的量化原则
Amdahl定律为计算某些情况下的加速比提供了一 种简洁的方法,加速比取决于以下两个因素
1)在原有的计算机上,能被改进并增强的部分在总执行时 间中所占的比例 2)通过增强的执行方式所取得的改进,即整个程序使用了 增强的执行方式后,该任务执行速度提高的程度
a为衡量工艺复杂度的参数,大概与掩膜层数相对应,对 多层金属CMOS生产流程而言,一般取a=4.0
1.6 成本的发展趋势
例子:设单位面积残次品密度为 ,分别求 边长为1.5cm和1.0cm晶片的成品率 1.5cm晶片成品率为
1.0cm晶片成品率为 结论:晶片面积越小,成品率越高
1.7 可靠性
模块可靠性
1.3 计算机系统结构定义
其他方面:设计满足目标和功能要求的组成和硬 件
实现包括两部分内容:组成和硬件 组成:涵盖计算机设计的更高层次,如存储系统、存储器互 连以及CPU(实现算术、逻辑、转移和数据传输指令) 硬件:是一台计算机的具体实现技术,包括逻辑设计和封装 技术
系统结构最终定义:包含计算机设计的三个 方面---指令集系统结构、组成和硬件
带宽的提高速度明显优于时延的提高速度(P10 图1.8),带宽有了1000-2000倍的提高,时 延则改进20-40倍,经验法则是带宽的提高速 度至少相当于时延改进速度的平方
1.4 实现技术的发展趋势
晶体管性能与连线的规模
特征尺寸:表征集成电路的加工工艺,是晶体管 或连线在x或y方向上的最小尺寸,从1971年 到2006年,特征尺寸从10微米降到0.09微米 晶体管密度:由于芯片上单位面积晶体管数目由 单个晶体管表面积大小决定,所以晶体管密度 与特征尺寸大小的平方成反比 与晶体管性能改进相比,连线延迟改进空间更大
1.3 计算机系统结构定义
2)存储器寻址 使用字节形式访问存储器中的操作数 3)寻址方式 寻址方式需要明确指出操作数的地址(特殊寄存器和 常量除外),有多种方式寻址,如寄存器寻址、立即数 寻址、相对寻址和变址寻址等 4) 操作数类型及大小 操作数大小有8位(ASCII码)、16位(unicode码或 半字)、32位(整型或字)和64位(长整型或双字)
1.4 实现技术的发展趋势
4)网络实现技术 交换和传输的性能决定了网络的性能,网络的发展趋势 参考附录E
以上四种技术的快速发展,可使计算机设计 的生存周期延长至5年或更长
1.4 实现技术的发展趋势
性能的发展趋势:带宽优于时延
带宽或吞吐量:给定的时间内完成的工作总量 时延或响应时间:从事件开始到完成所需要的时间
1.3 计算机系统结构定义
指令集系统结构
指令集系统结构(ISA,Instruction Set Architecture)指的是可见的实际指令系统, ISA作 用相当于硬件和软件之间的分界
包含以下内容:
1)ISA分类 归类为通用寄存器系统结构,其操作数是寄存器或 者存储器地址,16/32位通用寄存器或浮点寄存器
核心内容:计算机量化研究方法对程序的观 察实验和模拟
1.2 计算机的分类
桌面计算机
占有市场最大份额,从低端到高端不等,性 价比是设计者关注的焦点,桌面计算机是最 新、最高性能微处理器和低成本微处理器最 先应用的领域
1.2 计算机的分类
服务器
提供更大规模及更可靠文件与计算服务,万维网的出 现加速了这种服务 服务器注重以下特性: 1)可靠性 最关键,必须保证长期运转,不能出现故障,否则后果 很严重,会造成重大经济损失(P4 图1.3) 2)可扩展性 随服务需求或功能需求能随之扩展 3)吞吐量 单位时间处理的事务数要越多越好