向量处理机学习指南

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

向量处理机

【学习指南】

一.首先透切理解以下基本概念:向量、向量处理三种算法、向量处理机两种结构、链接、向量指令处理时间、最大性能R ∞、半性能向量长度

1. 把N 个互相独立的数叫做“向量”,对这样一组数的运算叫做“向量处理”。一条向量指令可以处理N 个或N 对操作数。

2. 向量处理的方式

(1).

横向处理方式:向量计算是按行的方式从左至右横向进行。 (2).

纵向处理方式:向量计算是按列的方式自上而下纵向进行。 (3). 纵横处理方式:横向处理和纵向处理相结合的方式

3. 向量处理机一般有如下两种结构:

(1). 利用几个独立的内存模块来支持对相互独立的资料的并发访问,从而达到所要求的内存带宽,即存储器—存储器结构。在运算流水线的输入端和输出端增加了缓冲器以便消除争用内存的现象。

(2). 构造一个具有所要求带宽的高速中间内存,并能实现该高速中间内存与主存储器之间的快速资料交换,即寄存器—寄存器结构。设计这种系统结构的主要思想是使操作数离处理器很近,以保证处理器一直处于忙状态。中间内存提供给处理器快速存取的资料,而成本又比较低。

4. 提高向量处理机性能的常用技术

(1). 链接技术

(2). 向量循环或分段开采技术

5. 向量指令的处理时间

其中,T s 为向量流水线的建立时间,它包括向量起始地址的设置、计数器加1、条件转移指令执行等。T vf 为向量流水线的流过时间,它是一条指令从开始译码到流过流水线得到第一个结果元素的时间。T c 为流水线“瓶颈”段的执行时间。

一组向量操作的执行时间主要取决于下面三个因素:向量的长度、向量操作之间是否存在流水功能部件的冲突和数据的相关性。

c

vf s vp T n T T T )1(-++=

9 最大性能R ∞表示当向量长度为无穷大时的向量流水线的最大性能。常在评价峰值性能时使用,单位为MFLOPS 。它可表示为:

因为分子的值与n 无关,所以

6. n 1/2为达到一半R ∞值所需的向量长度。它是评价向量流水线建立时间对性能影响的参数。它表示为建立流水线而导致的性能损失。

二.通过做例题和习题,会做下列类型的计算题:

(1)判别并行、链接的条件

(2)计算向量处理时间

[题]一台单处理机可以以标量方式运行,也可以以向量方式运行。在向量方式情况下,计算可比标量方式快9倍。设某基准程序在此计算机上运行的时间为T 。另外,已知T 的25%用于向量方式,其余的时间则以标量方式运行。

(1) 计算在上述条件下与完全不用向量方式条件下相比的加速比,并计算上述程序中向量化代码所占的比例α。

(2) 假设我们改进硬件使向量方式与标量方式之间的速度比加倍,试计算可达到的加速比。

(3) 如果要达到与(2)相同的加速比,用的方法是改进编译器,而不是改进硬件,那么,用向量化编译器支持同样的基准程序,其新的向量化比率是多少?

[解](1)由于T 中向量化代码所占的时间为0.25T ,则串行代码用时=T-0.25T=0.75T ,所以完全不用向量方式执行该段代码用时= 0.75T+9*0.25T=3T, 因此加速比=3T/T=3. 根据Amdahl 定律.

911

α+-=; 所以%75=α

(2) 加速比43.31875.075.011

=+-=;

循环所花费的时钟周期时钟频率浮点运算次数⨯=∞∞→lim n R ⎥⎥

⎤⎢⎢⎡⨯=⨯=∞∞→∞→n Tn R n n lim lim 时钟频率浮点运算次数数循环所花费的时钟周期时钟频率浮点运算次数

(3)由题意:911

43.3α

α+-=; 因此,%80=α

相关文档
最新文档