第2章 Pentium系列微处理器的基本结构

合集下载

微型计算机原理及应用第三版课后答案

微型计算机原理及应用第三版课后答案【篇一：《微型计算机原理及应用》课后习题答案】=txt>第一章1.1 解释题(1) 微处理器【解答】由大规模集成电路芯片构成的中央处理器（cpu），叫做微处理器。

(2) 微型计算机【解答】以微处理器为基础，配以内存储器、输入输出接口电路、总线以及相应的辅助电路而构成的计算机裸机，叫做微型计算机。

(3) 微型计算机系统【解答】微型计算机系统由硬件系统和软件系统组成。

即由微型计算机、配以相应的外部设备（如打印机、显示器、键盘、磁盘机等），再配以足够的软件而构成的系统。

(4) 单板机【解答】将微处理器、ram、rom以及i/o接口电路，再配上相应的外设（如小键盘、led显示器等）和固化在rom中的监控程序等，安装在一块印刷电路板上构成的微型计算机系统称为单板机。

(5) 运算器【解答】运算器是直接完成各种算术运算、逻辑运算的部件，主要由alu（arithmetic and logic unit,算术逻辑部件）、通用寄存器、标志寄存器等组成。

(6) 地址总线【解答】地址总线是cpu对内存或外设进行寻址时，传送内存及外设端口地址的一组信号线。

地址总线的条数多少决定了cpu的寻址能力。

(7) 数据总线【解答】数据总线是cpu与内存或外设进行信息交换时，所用的一组数据信号线。

它决定了cpu一次并行传送二进制信息的位数，反映出cpu的“字长”这个重要性能指标。

(8) 控制总线【解答】控制总线是在cpu与外部部件之间传送控制信息（如读/写命令、中断请求命令等）的一组信号线。

1-2 单片机应包括哪些基本部件？其主要应用于哪些领域？【解答】一般单片机芯片中包括微处理器、ram、rom、i/o接口电路、定时器/计数器，有的还包括a/d、d/a转换器等。

其主要应用于智能化仪器仪表及工业控制领域。

1-3 按图1-11和图1-12，写出取第二条指令操作码和执行第二条指令的过程。

【解答】1) ip的值（002h）送入地址寄存器ar；2) ip的内容自动加1，变为003h；3) ar将地址码通过地址总线送到存储器的地址译码器，经译码后选中002h单元；4) 微处理器给出读命令；5) 所选中的002h单元内容04h送上数据总线db；6) 数据总线db上的数据04h送到数据寄存器dr；7) 因是取指操作，取出的是指令操作码04h，即由dr送入指令寄存器ir；8) ir中的操作码经指令译码器id译码后，通过pla发出执行该指令的有关控制命令。

Pentium微处理器

10
§2.5
Itanium微处理器
地址总线６４位数据总线６４位地址总线６４位，数据总线６４位，内部集成度为６４６４ 2.2亿个晶体管，约是Pentium的10倍。亿个晶体管，约是的倍亿个晶体管特点：特点：
可有三级Cache；；可有三级多个执行部件和多个通道；多个执行部件和多个通道；数量众多寄存器；数量众多寄存器；采用完全并行指令计算技术；采用完全并行指令计算技术；采用新机制的分支预测技术。采用新机制的分支预测技术。
11
本节结束，谢谢合作！
12
2．分支预测技术
为了减少由于转移导致流水线的效率损失， Pentium采用分支预测技术来动态预测指令的目标 Pentium 采用分支预测技术来动态预测指令的目标地址，从而节省了CPU的执行时间。 CPU的执行时间地址，从而节省了 CPU 的执行时间。通常在用户程序中包含不少的条件转移指令，在流水线计算机中，序中包含不少的条件转移指令，在流水线计算机中，这些转移指令由于产生分支可能使予取和予译码指令作废。 Pentium内部有两个予取指令缓冲队列内部有两个予取指令缓冲队列，令作废。 Pentium内部有两个予取指令缓冲队列，在执行条件转移指令前，一个以顺序方式予取指令，在执行条件转移指令前，一个以顺序方式予取指令，另一个以转移方式予取
6
4．更快的浮点运算单元
浮点运算过程分为8个流水步级，浮点运算过程分为 8 个流水步级，前 4 步同整数流水线，接下来两步为二级浮点操作，流水线，接下来两步为二级浮点操作，最后两步为写结果、出错报告等。写结果、出错报告等。浮点运算单元对一些常用指令如ADD、MUL等不是采用微程序而是由硬件实现，等不是采用微程序，令如ADD、MUL等不是采用微程序，而是由硬件实现， ADD 使浮点运算速度更快。使浮点运算速度更快。

第2章微型计算机的组成及应用

2. 微型计算机分类
按主机、I/0接口和系统总线组成部件所在位置划分为：
① 单片机：组成部件集成在一个超大规模芯片上，用于控制仪器仪表等。、
② 单板机：各组成部件装配在一块电路板上，常用于实验控制。
③ 多板机：各组成部件装配在多块电路板上，如台式微型计算机、便携式PC机。
2.1.2 微型计算机系统的配件
2.4.2 CMOS
“小随机存储器”，靠电池供电。用于保存系统当前配置，如系统日期和时间、硬盘格式和容量、内存容量等。这些信息既是系统启动时必读信息，也是更新硬件时要修改的信息。
2.4.3 高速缓存Cache
为了解决CPU与内存之间速度不匹配的问题，引入高速缓存技术。高速缓存介于内存和CPU之间，是高速存取信息的芯片。它存取速度比内存快，但容量不大，主要用于存放当前使用最多的程序段和数据块，并以接近CPU的速度向CPU提供程序指令和数据。
AGP（Accelerated Graphics Port）扩展槽：专门用于图形显示卡，是在PCI总线基础上发展起来的，主要针对图形显示方面进行了优化。AGP插槽通常是棕色，随着显卡速度的提高， AGP接口已经不能满足显卡传输数据速度的要求，目前AGP 显卡已经逐渐被PCI Express接口显卡所取代。
2.4 微型机系统存储器
内存是微机重要配置之一，内存容量及性能是影响微机性能的重要因素。在Pentium Ⅲ系列微型计算机中，内存条以使用168 Pin SDRAM(同步动态随机存取存储器 )型为主，目前在 Pentium 4系列微型计算机中，多数采用DDR内存条。
图2.3.1 微型计算机内存储器（条）
为方便识别主板上的各种接口，PC99技术规格规范了主板设计要求，提出主板各接口必须采用颜色识别标识。

微处理器的体系结构

兼容性
针对系列计算机要求所有机种间能够保持向上兼容和向后兼容向上兼容：为某个档次机种编制的软件能够不加修改地运行在比它高档的机种上向后兼容：为某个时期生产的机种编制的软件能够不加修改地运行在它之后生产的机种上 Pentium微处理器的运行模式：实模式、保护模式
兼容性针对（软件）体系结构，非硬件实现
1000：1234 0100：ABCD
计算机体系结构是程序员所看到的系统的一些属性：概念性的结构和功能上的表现，这些属性既不同于数据流和控制的组织，也不同于逻辑设计和物理实现。
Amdahl,1964
计算机体系结构是连接硬件和软件的一门学科，它研究的内容不但涉及计算机硬件，也涉及计算机软件。
计算机体系结构与计算机组成
区别在于关心的问题不同： •计算机体系结构关心的是怎样合理地进行软硬件功能分配，为软件人员提供适用的计算机 •计算机组成关心的是怎样合理地实现分配给硬件的功能和指标，提高性能价格比
第二章 Pentium微处理器的体系结构
2.1 计算机体系结构的含义 2.2 Pentium微处理器的内部结构 2.3 实模式软件体系结构 2.4 保护模式软件体系结构 2.5 浮点部件软件体系结构
2.1 计算机体系结构的含义
计算机体系结构 = computer architecture (计算机系统结构)
简单指令：完全由硬件执行而无需任何微码控制，在一个时钟周期内执行的指令
•mov reg, reg/mem/imm •mov mem,reg/imm •alu reg, reg/mem/imm •alu mem, reg/imm •inc reg/mem •dec reg/mem •push reg/mem •pop reg •lea reg, mem •jmp/call/jcc near •nop

微型计算机原理及应用第三版课后答案

(2) 微型计算机【解答】以微处理器为基础，配以内存储器、输入输出接口电路、总线以及相应的辅助电路而构成的计算机裸机，叫做微型计算机。

(3) 微型计算机系统【解答】微型计算机系统由硬件系统和软件系统组成。

即由微型计算机、配以相应的外部设备（如打印机、显示器、键盘、磁盘机等），再配以足够的软件而构成的系统。

(6) 地址总线【解答】地址总线是cpu对内存或外设进行寻址时，传送内存及外设端口地址的一组信号线。

地址总线的条数多少决定了cpu的寻址能力。

(7) 数据总线【解答】数据总线是cpu与内存或外设进行信息交换时，所用的一组数据信号线。

它决定了cpu一次并行传送二进制信息的位数，反映出cpu的“字长”这个重要性能指标。

(8) 控制总线【解答】控制总线是在cpu与外部部件之间传送控制信息（如读/写命令、中断请求命令等）的一组信号线。

其主要应用于智能化仪器仪表及工业控制领域。

1-3 按图1-11和图1-12，写出取第二条指令操作码和执行第二条指令的过程。

32位微处理器的结构

15个NC/INC引脚,必须保持在非连接状态
Pentium微处理器的电气特性
以P54C为例
电源要求
所有Vcc输入都是3.3V 输入和输出都是3.3V的JEDEC标准电平，两者均为TTL兼容的 CLK和PICCLK输入可允许接收5V的输入信号，因而可以使用5V或3.3V的时钟驱动器
直流特性
Ü × ß Ï ¿ ² þ ¼
× Ö ¿ Æ ² ¿ ¼ þ ¡ µ · ã ² ¿ ¼ þ ¿ Æ × Ö ¼ ´ Ä æ Æ ÷é × Ó · ¼ ¨Æ ÷ ý · ³ ¨Æ ÷ Ë · ³ ¨Æ ÷ 80
µ Ö × ·É ú É ³ (UÁ ÷Ë ® Ï ß )
µ Ö × ·É ú É ³ (UÁ ÷Ë ® Ï ß )
1. 寄存器结构
指令指针IP 段寄存器CS,DS,SS,ES,FS,GS 通用寄存器EAX,EBX,ECX,EDX 变址寄存器ESI,EDI 指针寄存器EBP,ESP 标志寄存器FLAGS
31 EAX EBX ECX EDX ESP EBP ESI EDI
16
15 8 7 AH BH CH DH AL BL CL DL
0 AX BX CX DX SP BP SI DI FLAGS
CR0
标志寄存器
2. 段寄存器和存储器分段 1MB的存储空间被分成段，每段64KB 段是可独立寻址的存储器部分 6个段寄存器：保存16位段基址 CS 代码段 SS 堆栈段 DS 数据段 ES 附加段 FS 数据段F GS数据段G
2.4 Pentium微处理器的内部结构
1. Pentium微处理器的外形和特性 1993年开始推出，共生产三代： •P5(Pentium 60/66) 0.8m, 5V电压 •P54C(Pentium 75/90/100/120/133/150/166/200), 0.6m, 3.8V电压 •P55C(Pentium MMX 166/200/233), 0.35m, 2.8V电压集成度：310万晶体管/片

微机原理及应用课件第2章

四、内部寄存器
内部寄存器的类型
含14个16位寄存器，按功能可分为三类
8个通用寄存器 4个段寄存器 2个控制寄存器
深入理解：每个寄存器中数据的含义
28
1. 通用寄存器
数据寄存器（AX，BX，CX，DX）地址指针寄存器（SP，BP）变址寄存器（SI，DI）
29
数据寄存器
8088/8086含4个16位数据寄存器，它们又可分为8个 8位寄存器，即：
DX：
数据寄存器。在间接寻址的I/O指令中存放I/O端口地址；在 32位乘除法运算时，存放高16位数。
地址指针寄存器
SP：堆栈指针寄存器，其内容为栈顶的偏移地址； BP：基址指针寄存器，常用于在访问内存时存放内存单
元的偏移地址。
BP与BX的区别：
作为通用寄存器，二者均可用于存放数据；作为基址寄存器，用BX表示所寻找的数据在数据段；用
┇
操作数
35
状态标志位（1）
CF（Carry Flag）
进位标志位。加(减)法运算时，若最高位有进(借)位则CF=1
OF（Overflow Flag）
溢出标志位。当算术运算的结果超出了有符号数的可表达范围时，OF=l
ZF（Zero Flag）
零标志位。当运算结果为零时ZF=1
SF（Sign Flag）
欲实现对1MB内存空间的正确访问，每个内
存单元在整个内存空间中必须具备20位字长
的惟一地址
物理地址
XXXXXH
12H
00H
内存地址变换：
…
如何将直接产生的16位编码变换
…
为20位物理地址?
┇
内存单元的编址（1）
内存每个单元的地址在逻辑上都由两部分组成：

大学_《微型计算机原理及应用》(吴宁著)课后习题答案下载

《微型计算机原理及应用》(吴宁著)课后习题答案下载《微型计算机原理及应用》(吴宁著)内容提要目录第1章计算机基础1.1 数据、信息、媒体和多媒体1.2 计算机中数值数据信息的表示1.2.1 机器数和真值1.2.2 数的表示方法——原码、反码和补码1.2.3 补码的运算1.2.4 定点数与浮点数1.2.5 BCD码及其十进制调整1.3 计算机中非数值数据的信息表示1.3.1 西文信息的表示1.3.2 中文信息的表示1.3.3 计算机中图、声、像信息的表示1.4 微型计算机基本工作原理1.4.1 微型计算机硬件系统组成1.4.2 微型计算机软件系统1.4.3 微型计算机中指令执行的基本过程 1.5 评估计算机性能的主要技术指标1.5.1 CPU字长1.5.2 内存储器与高速缓存1.5.3 CPU指令执行时间1.5.4 系统总线的传输速率1.5.5 iP指数1.5.6 优化的内部结构1.5.7 I/O设备配备情况1.5.8 软件配备情况习题1第2章 80x86/Pentium微处理器2.1 80x86/Pentium微处理器的内部结构 2.1.1 8086/8088微处理器的基本结构2.1.2 80386CPU内部结构2.1.3 80x87数学协处理器2.1.4 Pentium CPU内部结构2.2 微处理器的主要引脚及功能2.2.1 8086/8088 CPU引脚功能2.2.2 80386 CPU引脚功能2.2.3 Pentium CPU引脚功能2.3 系统总线与典型时序2.3.1 CPU系统总线及其操作2.3.2 基本总线操作时序2.3.3 特殊总线操作时序2.4 典型CPU应用系统2.4.1 8086/8088支持芯片2.4.2 8086/8088单CPU(最小模式)系统 2.4.3 8086/8088多CPU(最大模式)系统 2.5 CPU的工作模式2.5.1 实地址模式2.5.2 保护模式2.5.3 虚拟8086模式2.5.4 系统管理模式2.6 指令流水线与高速缓存2.6.1 指令流水线和动态分支预测2.6.2 片内高速缓存2.7 64位CPU与多核微处理器习题2第3章 80x86/Pentium指令系统3.1 80x86/Pentium指令格式3.2 80x86/Pentium寻址方式3.2.1 寻址方式与有效地址EA的概念 3.2.2 各种寻址方式3.2.3 存储器寻址时的段约定3.3 8086/8088 CPU指令系统3.3.1 数据传送类指令3.3.2 算术运算类指令3.3.3 逻辑运算与移位指令3.3.4 串操作指令3.3.5 控制转移类指令3.3.6 处理器控制类指令3.4 80x86/Pentium CPU指令系统3.4.1 80286 CPU的增强与增加指令 3.4.2 80386 CPU的增强与增加指令 3.4.3 80486 CPU增加的指令3.4.4 Pentium系列CPU增加的指令 3.5 80x87浮点运算指令3.5.1 80x87的数据类型与格式3.5.2 浮点寄存器3.5.3 80x87指令简介习题3第4章汇编语言程序设计4.1 程序设计语言概述4.2 汇编语言的程序结构与语句格式 4.2.1 汇编语言源程序的框架结构4.2.2 汇编语言的语句4.3 汇编语言的伪指令4.3.1 基本伪指令语句4.3.2 80x86/Pentium CPU扩展伪指令 4.4 汇编语言程序设计方法4.4.1 程序设计的基本过程4.4.2 顺序结构程序设计4.4.3 分支结构程序设计4.4.4 循环结构程序设计4.4.5 子程序设计与调用技术4.5 模块化程序设计技术4.5.1 模块化程序设计的特点与规范4.5.2 程序中模块间的关系4.5.3 模块化程序设计举例4.6 综合应用程序设计举例4.6.1 16位实模式程序设计4.6.2 基于32位指令的实模式程序设计 4.6.3 基于多媒体指令的实模式程序设计 4.6.4 保护模式程序设计4.6.5 浮点指令程序设计4.7 汇编语言与C/C 语言混合编程4.7.1 内嵌模块方法4.7.2 多模块混合编程习题4第5章半导体存储器5.1 概述5.1.1 半导体存储器的分类5.1.2 存储原理与地址译码5.1.3 主要性能指标5.2 随机存取存储器(RAM)5.2.1 静态RAM(SRAM)5.2.2 动态RAM(DRAM)5.2.3 随机存取存储器RAM的应用5.3 只读存储器(ROM)5.3.1 掩膜ROM和PROM5.3.2 EPROM(可擦除的PROM)5.4 存储器连接与扩充应用5.4.1 存储器芯片选择5.4.2 存储器容量扩充5.4.3 RAM存储模块5.5 CPU与存储器的典型连接5.5.1 8086/8088 CPU的'典型存储器连接5.5.2 80386/Pentium CPU的典型存储器连接 5.6 微机系统的内存结构5.6.1 分级存储结构5.6.2 高速缓存Cache5.6.3 虚拟存储器与段页结构习题5第6章输入/输出和中断6.1 输入/输出及接口6.1.1 I/O信息的组成6.1.2 I/O接口概述6.1.3 I/O端口的编址6.1.4 简单的I/O接口6.2 输入/输出的传送方式6.2.1 程序控制的输入/输出6.2.2 中断控制的输入/输出6.2.3 直接数据通道传送6.3 中断技术6.3.1 中断的基本概念6.3.2 中断优先权6.4 80x86/Pentium中断系统6.4.1 中断结构6.4.2 中断向量表6.4.2 中断响应过程6.4.3 80386/80486/Pentium CPU中断系统6.5 8259A可编程中断控制器6.5.1 8259A芯片的内部结构与引脚6.5.2 8259A芯片的工作过程及工作方式 6.5.3 8259A命令字6.5.4 8259A芯片应用举例6.6 82380可编程中断控制器6.6.1 控制器功能概述6.6.2 控制器主要接口信号6.7 中断程序设计6.7.1 设计方法6.7.2 中断程序设计举例习题6第7章微型机接口技术7.1 概述7.2 可编程定时/计数器7.2.1 概述7.2.2 可编程定时/计数器82537.2.3 可编程定时/计数器82547.3 可编程并行接口7.3.1 可编程并行接口芯片8255A7.3.2 并行打印机接口应用7.3.3 键盘和显示器接口7.4 串行接口与串行通信7.4.1 串行通信的基本概念7.4.3 可编程串行通信接口8251A7.4.3 可编程异步通信接口INS82507.4.4 通用串行总线USB7.4.5 I2C与SPI串行总线7.5 DMA控制器接口7.5.1 8237A芯片的基本功能和引脚特性 7.5.2 8237A芯片内部寄存器与编程7.5.3 8237A应用与编程7.6 模拟量输入/输出接口7.6.1 概述7.6.2 并行和串行D/A转换器7.6.3 并行和串行A/D转换器习题7第8章微型计算机系统的发展8.1.1 IBM PC/AT微机系统8.1.2 80386、80486微机系统8.1.3 Pentium及以上微机系统8.2 系统外部总线8.2.1 ISA总线8.2.2 PCI局部总线8.2.3 AGP总线8.2.4 PCI Express总线8.3 网络接口与网络协议8.3.1 网络基本知识8.3.2 计算机网络层次结构8.3.3 网络适配器8.3.4 802.3协议8.4 80x86的多任务保护8.4.1 保护机制与保护检查8.4.2 任务管理的概念8.4.3 控制转移8.4.4 虚拟8086模式与保护模式之间的切换 8.4.5 多任务切换程序设计举例习题8参考文献《微型计算机原理及应用》(吴宁著)目录本书是普通高等教育“十一五”国家级规划教材和国家精品课程建设成果，以教育部高等学校非计算机专业计算机基础课程“基本要求V4.0”精神为指导，力求做到“基础性、系统性、实用性和先进性”的统一。

《微机原理及应用》各章习题参考答案

《微机原理及应用》各章习题参考答案第1章微型计算机概论一、填空题1. 微机硬件系统主要由CPU、（存储器）、（总线）、（输入输出接口）和输入输出设备组成。

2. 冯·诺依曼计算机的核心原理是（存储程序原理）3. 完成下列数制的转换1）10100110B=（ 166 ）D=（ A6H ）H2）223.25 =（ 11011111.01 ）B=（ DF.4 ）H3）1011011.101B=（ 5B.A ）H=（1001 0001.01100010 0101 ）BCD4. 已知[X]补5. 已知A=10101111，B=01010000，则A∧B的结果为( 00000000 ) B=86H，则X的十进制表示形式为( -122 )6. -29H的8位二进制反码是（11010110 ）B7.字符4的ASCII码=（ 34 ）H二、简答题1.冯.诺依曼计算机的结构是怎样的，主要特点有哪些？解：将计算机设计为由运算器、控制器、存储器、输入设备和输出设备等5个部分组成，所有的执行都以运算器为核心，采用存储程序工作原理。

2. 已知X=-1101001B，Y=-1010110B，用补码方法求X-Y=？解：[X-Y]补=[X+（-Y）]补= [X]补+[-Y] [X]补原=11101001B [X]补 [-Y]=10010111B原=01010110B=[-Y] [X-Y]补补= [X]补+[-Y]补X-Y=[[X-Y]=11101101B补]补=10010011=-0010011=-193. 写出下列真值对应的原码和补码的形式：1）X=-1110011B2）X=-713）X=+1001001B解：1）[X]原码=11110011B , [X]补码=10001101B2）[X]原码=11000111B, [X]补码=10111001B3）[X]原码=01001001, [X] 补码=01001001B=?4. 已知X和Y的真值，求[X+Y]补1）X=-1110111B Y=+1011010B2）X=56 Y=-215. 若与门的输入端A、B、C的状态分别为1、0、1，则该与门的输出端状态为？若将这3位信号连接到或门，那么或门的输出又是什么状态？解：由与和或的逻辑关系知，若“与”门的输入端有一位为“0”，则输出为“0”；若“或”门的输入端有一位为“1”，则输出为“1”。

微机原理作业参考答案

DIV DIVISOR
MOV XX, AX
第四次
教材P. 69-70习题4.4-4.8中任选3题
习题4.4
MOV CL, 4
SHL AH, CL
MOV BL, 0FH
AND AL, BL
OR AH, AL
习题4.5
MOV CX, 8
MOV BL, 0
L1:
SHL AL, 1
RCR BL ,1
LOOP L1
INC SI
JLOOP:
INC BX
LOOP L1
（3）
本程序片段将求得的绝对值送数据段ABS开始的单元中
MOV BX, OFFSET BUF
MOV SI, OFFSET ABS
MOV CX, 50
L1:
MOV AL, [BX]
CMP AL ,0
JGE JLOOP
NEG AL
JLOOP:
MOV [SI], AL
在保护模式下，Pentium处理器可以直接寻址高达4GB的物理存储器。存储器的硬件空间被组织成64位的单元，每个64位的单元有8个可独立寻址的字节，这8个字节有连续的存储器地址，如下图所示。
在保护模式下，通过地址线A31~A3和字节选通信号BE7#~BE0#访问存储器，由地址线A31~A3选择64位的存储单元，由字节选通信号BE7#~BE0#选择相应的字节。
第五个时钟ads被置起有效地址b和第二个总线周期的总线状态被驱动送出wr被驱动为高电平表明为一个写周期cache被驱动为高电平表明该周期为非缓存式总线周期故第二个总线周期为非缓存式单次传送写周期
第一次
1.微型计算机系统有哪三个层次，简述其内涵及其联系与区别
略
2.试述冯诺依曼存储程序工作原理

微处理器的主要组成部分

微处理器的主要组成部分（资料来源：中国联保网）微处理器由算术逻辑单元（ALU，Arithmetic LogicalUnit）；累加器和通用寄存器组；程序计数器（也叫指令指标器）；时序和控制逻辑部件；数据与地址锁存器/缓冲器；内部总线组成。

其中运算器和控制器是其主要组成部分.算术逻辑单元算术逻辑单元ALU主要完成算术运算（+，－、×、÷、比较）和各种逻辑运算（与、或、非、异或、移位）等操作。

ALU是组合电路，本身无寄存操作数的功能，因而必须有保存操作数的两个寄存器：暂存器TMP和累加器AC，累加器既向ALU提供操作数，又接收ALU的运算结果。

寄存器阵列实际上相当于微处理器内部的RAM，它包括通用寄存器组和专用寄存器组两部分，通用寄存器（A，B，C，D）用来存放参加运算的数据、中间结果或地址。

它们一般均可作为两个8位的寄存器来使用。

处理器内部有了这些寄存器之后，就可避免频繁地访问存储器，可缩短指令长度和指令执行时间，提高机器的运行速度，也给编程带来方便。

专用寄存器包括程序计数器PC、堆栈指示器SP和标志寄存器FR，它们的作用是固定的，用来存放地址或地址基值。

其中：A）程序计数器PC用来存放下一条要执行的指令地址，因而它控制着程序的执行顺序。

在顺序执行指令的条件下，每取出指令的一个字节，PC的内容自动加1。

当程序发生转移时，就必须把新的指令地址（目标地址）装入PC，这通常由转移指令来实现。

B）堆栈指示器SP用来存放栈顶地址。

堆栈是存储器中的一个特定区域。

它按“后进先出”方式工作，当新的数据压入堆栈时，栈中原存信息不变，只改变栈顶位置，当数据从栈弹出时，弹出的是栈顶位置的数据，弹出后自动调正栈顶位置。

也就是说，数据在进行压栈、出栈操作时，总是在栈顶进行。

堆栈一旦初始化（即确定了栈底在内存中的位置）后，SP的内容（即栈顶位置）使由CPU自动管理。

C）标志寄存器也称程序状态字（PSW）寄存器，用来存放算术、逻辑运算指令执行后的结果特征，如结果为0时，产生进位或溢出标志等。

NEW02_第二章_微处理器_part2

微机原理与接口
Pentium性能简介
Pentium通往外部存储器的数据总线为64位， CPU内部主要寄存器的宽度仍然为32位，那么 Pentium、Pentium（P54C）应该是32位微处理器。外部64位数据总线（D63-D0）每次可同时传输8 字节的二进制信息，若选用主总线时钟频率66MHz 计算，即存储器总线的时钟频率也为66MHz，则 Pentium与主存储器交换数据的速率可为528MB/S 。
微机原理与接口
Pentium CPU原理结构图
微机原理与接口
2.6.1 Pentium的原理结构
二、原理结构在Pentium CPU中，总线接口部件实现 CPU与系统总线之间的连接，其中包括64位双向的数据线、32位地址线和所有的控制信号线，具有锁存与缓冲等功能，总线接口部件实现CPU与外设之间的信息交换，并产生相应的各类总线周期。
··· ·· ··
微机原理与接口
从上述程序可以看出，许多分支转移指令转向每个分支的机会不是均等的，而且大多数分支转移指令排列在循环程序段中，除了一次跳出循环体之外，其余转移的目标地址均在循环体内。因此，分支转移指令的转移目标地址是可以预测的，预测的依据就是前一次转移目标地址的状况，即根据历史状态预测下一次转移的目标地址。预测的准确率不可能为100%，但是对于某些转移指令预测的准确率却非常高。

U、V流水线中整数指令流水线均由5段组成。分别为预取指令（PF）、指令译码（D1）、地址生成（ D2）、指令执行（EX）和结果写回（WB）。
由于采用了指令流水线作业，每条指令流水线可以在1个时钟周期内执行一条指令。因此，最佳情况下一个时钟周期内可以执行两条整数指令。
微机原理与接口

第2章 Pentium系列微处理器的基本结构

SSE指令集包括了70条指令，其中包含提高3D图形运算效率的50条SIMD(单指令多数据技术)浮点运算指令、12 条MMX 整数运算增强指令、8条优化内存中连续数据块传输指令。
与P2时代的MMX相比，SSE也是在原来的处理器指令集的基础上添加的扩展指令集，都是SIMD(单指令多数据) 指令，不同的是他们处理的数据类型不同. MMX只能在整数上支持SIMD，而SSE指令增加了单精度浮点数的 SIMD支持.MMX可以进行同时对2个32位的整数操作，而SSE可以同时对4个32位的浮点数操作。MMX和SSE 的一个主要的区别是MMX并没有定义新的寄存器，而 SSE定义了8个全新的128位寄存器，每个寄存器可以同时存放4个单精度浮点数(每个32位长)，
② 空间并行---指资源重复。实现形式主要为多处理器系统和多计算机系统；
③ 时间并行＋空间并行---时间重叠和资源重复的综合应用，例：超标量流水技术。
流水工作方式：将一个计算任务细分成若干
个子任务，每个子任务由专门的部件处理，多个计算任务依次进行并行处理。
流水线中主要存在三种相关冲突，会使流水线发生断流，而不能充分发挥作用，因此需采取相应的技术对策。
2.MMX
8个MMX寄存器MM0—MM7的宽度为64位，但它们没有单独设置，而是借用浮点处理单元中的8 个(80位)数据寄存器，它是通过使用“别名”的办法来实现的。即浮点单元的8个数据寄存器被浮点指令看成ST0—ST7，被MMX指令看成是MM0— MM7。
这样，8个字节或4个字或2个双字被打包装入一个64位的MMX寄存器，一旦执行一条MMX指令时，将所有这些8个、4个或2个的数据同时取出，进行数学运算或逻辑操作，最后结果写入MMX寄存器。事实上，这种运算处理过程是一种并行处理过程，故称为SIMD(单指令多数据)的并行处理。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

控制寄存器组
整数寄存器组 64 64位数据总线 32 32位地址总线 ALU（U流水） ALU（V流水） 32 32 TLB 32 数据高速缓存（8KB） 80 桶形移位器
加法除法 80 乘法
2.1.1总线接口部件 1.地址收发器和驱动器 2.数据总线收发器 3.总线宽度控制
4.写缓冲
5.总线周期和总线控制
2.4 Pentium PⅡ
Pentium PⅡ系列微处理器是在Pentium Pro CPU基础上融入MMX技术，优化16位代码。PⅡ系列CPU采用双重独立总线技术，芯片设计上把2级高速缓存移至微处理芯片外，将CPU与L2装在同1块基块上，然后封装在黑色卡匣里，构成1个完整的处理器插件，L2容量为512KB，并以CPU主频的一半速度运行，在结构上，采用Solt 1接口标准和单边接触盒（SECC）封装技术，用新型Slot 1插头与主板相连。
2.1.6指令译码部件
两条同时译码，同时传给两条流水线
2.1.7控制部件
微程序控制的基本思想是将指令操作分解为微指令
序列，每一条微指令又包含若干可同时进行的微操作。微程序被固化在ROM中，在操作时将根据机器指令不断取出微指令并执行微指令，从而实现指令规定的操作功能。
2.2Pentium Pro微处理器
1.多媒体增强技术 SIMD 新增57条MMX指令 2.动态执行技术多分支跳转预测数据流分析：处理顺序推测执行 3.双重独立总线结构
饱和运算方式这是运算发生溢出时使用的处理方法。如果运算结果超过最大值，则将此值按最大值处理，低于最小值时按最小值处理。由于不需要进行溢出处理，所以提高了处理能力。饱和运算适合于面向像素数据的处理。积和运算方式 MMX的乘法指令中，PMADDWD指令是一条关键指令，它具有乘法-累加操作动能。下图说明了它的操作功能，将两个紧缩字类型的数中相应的元素(16位)相乘，生成4个32位的积，再将左侧的两个积相加，得出一个结果；右侧的两个积相加，得出另一个结果。这样便生成一个紧缩双字类型的结果数据。积和运算方式特别适合于向量计算与矩阵计算。
（3）控制相关：通常由转移指令引起，根据转移条件来控制指令的执行顺序，而造成断流。解决方法：① 延迟转移法，由编译程序重排指令序列,本思想是“先执行再转移”，即发生转移取时并不排空指令流水线，而是让紧跟在转移指令Ib之后已进入流水线的少数几条指令继续完成。如果这些指令是与Ib结果无关的有用指令，那么延迟损失时间片正好得到了有效的利用。 ② 转移预测法：由硬件方法来实现，依据指令过去的行为来预测将来的行为，通常设置顺序和转移两个指令预取队列。
Pentium Pro处理器中文名为“ 高能奔腾”，俗称686，是第一个基于RISC内核和32位软件的微处理器。
Pentium Pro CPU按双腔结构制作，含CPU和二级 Cache，使用Socket 8插座。主频150260 MHz。该主频很容易采用多处理器结构，适用于服务器。该芯片设计上注重了32位代码的优化，在网络 cache部件 80486 CPU中有8KB的指令和数据共用的 cache。而奔腾CPU则分设指令cache和数据 cache，各8KB。指令cache是只读的，以单端口256位(32B)向指令预取缓冲器提供超长指令字代码。数据cache是可读可写的，双端口，每个端口32位，与U，V两条流水线交换整数数据，或组合成一个64位端口与浮点运算部件交换浮点数据。两个cache与64位数据、32 位地址的CPU内部总线相连接。两个cache都使用物理地址。每个cache都有一个后援缓冲器TLB，负责将TLB命中的线性地址转换成32位物理地址。
并行性的两种含义： ① 同时性---两个以上事件在同一时刻发生。如多机系统中，同一时刻多个进程在运行。 ② 并发性---两个以上事件在同一间隔内发生。如并发程序，某一时刻CPU中只有一个进程在运行，而在一个时间段内，多个进程同时运行。并行性的三种形式： ① 时间并行---指时间重叠。实现形式即流水线方式； ② 空间并行---指资源重复。实现形式主要为多处理器系统和多计算机系统； ③ 时间并行＋空间并行---时间重叠和资源重复的综合应用，例：超标量流水技术。
–（2）超流水线和超标量技术
超流水线是指CPU内部的流水线超过通常的5～6步。流水线的步数越多，完成一条指令的速度就越快。超标量(Super-Scalar)是指CPU中有一条以上的流水线，并且每时钟周期可以完成一条以上的指令。
–3）乱序执行技术
乱序执行(Out-of-Order Execution)是指CPU采用了允许将多条指令不按程序规定的顺序，分开发送给各相应电路单元处理的技术。。。。。
(4)指令集中的指令数目一般少于100种，指令格式一般少于4种。 (5)指令功能简单，控制器多采用硬布线方式，以期更快的执行速度。 (6)平均而言，所有指令的执行时间为一个处理时钟周期。 (7)指令格式中用于指派整数寄存器的个数不少于 32个，用于指派浮点数寄存器的个数不少于16个。 (8)强调通用寄存器资源的优化使用。 (9)支持指令流水并强调指令流水的优化使用。 (10)RlSC技术的复杂性于它的编译程序，因此软件系统开发时间比CISC机器长。
6.齐偶效验的生成和控制
7.Cache控制
2.1.2预取缓冲部件指令预取技术 Pentium含有几个指令预取缓冲器，包括指令预取和指令译码两部分。
2.1.3整数流水线
（1）流水线技术
为了提高微型计算机的工作速度，可以采用某些功能部件分离的方法，使大的顺序操作分解为由不同功能部件分别完成、在时间上重叠的子操作，这种技术称为流水线技术。
紧缩字节类型：8个字节打包成一个64位数据
紧缩字类型：4个字打包成一个64位数据紧缩双字类型：两个32位的双字打包成一个64位数据四字类型：一个64位数。
2.MMX寄存器 8个MMX寄存器MM0—MM7的宽度为64位，但它们没有单独设置，而是借用浮点处理单元中的8 个(80位)数据寄存器，它是通过使用“别名”的办法来实现的。即浮点单元的8个数据寄存器被浮点指令看成ST0—ST7，被MMX指令看成是MM0— MM7。这样，8个字节或4个字或2个双字被打包装入一个64位的MMX寄存器，一旦执行一条MMX指令时，将所有这些8个、4个或2个的数据同时取出，进行数学运算或逻辑操作，最后结果写入MMX寄存器。事实上，这种运算处理过程是一种并行处理过程，故称为SIMD(单指令多数据)的并行处理。
RISC的三个要素是： (1)一个有限的简单的指令集；(2)CPU配备大量的通用寄存器；(3)强调对指令流水线的优化。基于三要素的RISC机器的特征是： (1)使用等长指令，目前的典型长度是4个字节。 (2)寻址方式少且简单，一般为2—3种，最多不超过4种，绝不出现存储器间接寻址方式。 (3)只有取数指令、存数指令访问存储器。指令中最多出现RS型指令，绝不出现SS型指令。
(4)动态转移预测技术
执行转移指令时为了不使流水线断流，pentium采用了动态转移预测技术。转移目标缓冲器BTB一个小容量的cache。当一条指令导致程序转移时，BTB便记录这条指令及其转移目标地址。以后遇到这条转移指令时，BTB会依据前后转移发生的历史来预测该指令这次是转移取还是顺序取。若预测为转移取，则将BTB记录的转移目标地址立即送出可用。两个指令预取缓冲器，每个容量为32字节，当前总是使用其中一个(假设为缓冲器1)。当在指译码(D1)段译出一条转移指令时立即检索BTB。若预测为“顺序取”，则继续从缓冲器1取指令；若预测为“转移取”，则立即冻结缓冲器1，启动另一个缓冲器2，由给出的转移目标地址处开始取分支程序的指令序列。这样，保证了流线的指令预取步骤永远不会空置。并且预测转移取错误时，正确路径的指令已经在另一个冲器中，使流水线的性能损失减至最小。
解决方法：① 延迟等待，使指令推迟执行； ② 设置重复资源，将指令和数据分别存放在两个存储器中。（2）数据相关：在一个程序中，如果必须等前一条指令执行完，才能执行后一条指令，这两条指令即为数据相关。当多条指令重叠处理时，可能发生冲突。解决方法：① 采用定向传送技术； ② 编译优化。
A-B-C A-C
流水CPU的时空图
图(a)表示流水CPU中一个指令周期的任务分解。
图(b)表示非流水计算机的时空图。
图(c)表示流水计算机的时空图
图(d)表示超标量流水计算机的时空图。
(a)(b)(c)(d)的动态演示请看动画演示
(1)超标量流水线超标量流水线是pentium系统结构的核心。它由U和V两条指令流水线构成，每条流水线都有自已的ALU、地址生成电路、与数据 cache的接口。控制ROM属于微程序控制器，其中存放一组解释指令操作顺序的微指令代码。两个地址生成器用于计算存储器操作数地址。各种模式下的逻辑地址最终要转换成物理地址来访问数据cache，并用转换后援（旁视）缓冲器TLB来加速这种地址转换过程。寄存器堆有8个32位整数寄存器，用于地址计算、保存ALU的源操作数和目的操作数。
流水工作方式：将一个计算任务细分成若干个子任务，每个子任务由专门的部件处理，多个计算任务依次进行并行处理。
流水线中主要存在三种相关冲突，会使流水线发生断流，而不能充分发挥作用，因此需采取相应的技术对策。（1）资源相关：指多条指令进入流水线后在同一机器时钟周期内争用同一个功能部件所发生的冲突。
(3)浮点流水线奔腾CPU内部包含了一个8段的流水浮点运算器。前4段为指令预取(PF)、指令译码(D1) 、地址生成(D2)、取操作数(EX)，在U，V流水线中完成；后4 段为执行1(X1)、执行2(X2)、结果写回寄存器堆(WF)、错误报告(ER)，在浮点运算部件中完成。一般只能由U流水线完成一条浮点数操作指令。