南开20春学期《并行程序设计》在线作业满分答案

合集下载

相关主题

南开在线作业答案

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

A加锁
B解锁
C加读琐
D加写锁
答案：D
6
SSE数据移动指令分类不包括____。
A对齐传输
B未对齐传输
C标量传输
D缓存传输
答案：D
7
SSE intrinsics _mm_load_pd命令的功能是____。
A对齐向量读取单精度浮点数
B未对齐向量读取单精度浮点数
C对齐向量读取双精度浮点数
D未对齐向量读取双精度浮点数A存在来自B不存在C不确定
D以上皆错
答案：A
36
SSE intrinsics _mm_hadd_ps命令的功能是____。
A寄存器间单精度浮点数向量加法
B寄存器间双精度浮点数向量加法
C寄存器内单精度浮点数加法
D寄存器内双精度浮点数加法
答案：C
37
一个Neon寄存器最多存放____个双精度浮点数。
答案：C
8
每个SSE寄存器宽度为____位。
A 32
B 64
C 128
D 256
答案：C
9
我国首次获得戈登•贝尔奖是在____年。
A 2015
B 2016
C 2017
D 2018
答案：B
10
FORTRAN语言存储二维数组采取____。
A行主次序存储
B列主次序存储
C交错式存储
D对角线存储
答案：B
11
对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?
A pthread_create
B pthread_join
C pthread_cancel
D pthread_get
答案：B
28
n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。
A肯定不是代价最优
B肯定是代价最优
C不确定是否代价最优
D以上皆错
答案：A
29
为防止编译器不支持OpenMP,应使用____实现OpenMP代码和普通代码的条件编译。
A 2
B 4
C 8
D 16
答案：B
20
OpenMP不会自动地在____位置设置barrier。
A并行结构开始
B并行结构结束
C其他控制结构开始
D其他控制结构结束
答案：C
21
关于障碍机制,下面说法错误的是____。
A会导致快速线程阻塞，不应使用
B在需要强制线程步调一致时，应使用
C可用互斥量机制实现
D属于一种组通信
答案：A
22
动态线程编程模式的缺点是____。
A线程管理开销高
B系统资源利用率低
C线程任务分配困难
D线程通信效率低
答案：A
23
任务依赖图中顶点权重之和表示____。
A任务数
B任务难度
C串行执行时间
D并行执行时间
答案：C
24
编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
南开20春学期《并行程序设计》在线作业满分答案
1
n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每
个线程负载的范围,存在的问题是____。
A负载不均
B通信开销大
C CPU空闲等待严重
D sum累加产生竞争条件，导致结果错误
答案：D
2
采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向
A 2
B 4
C 8
D 16
答案：C
25
CUDA的优点不包括____。
A可移植性
B入门简单
C标准的SPMD模式
D不再需要图形API
答案：A
26
为了实现向量计算,SIMD架构还需提供____。
A更大的内存容量
B更快的内存传输
C更宽的寄存器
D更快的网络传输
答案：C
27
主线程通过____函数获取特定线程的返回结果。
量化。
A 3
B 4
C 5
D 6
答案：D
3
OpenMP是___的一个常见替代。
A SSE
B MPI
C Pthread
D CUDA
答案：C
4
采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在____。
A CPU内存
B GPU显存
C GPU共享内存
D GPU寄存器
答案：C
5
pthread_rwlock_wrlock是对读写锁进行____操作。
A声明语句
B条件分支语句
C循环语句
D输入输出语句
答案：C
17
在使用互斥量之后必须对其进行____。
A初始化
B加锁
C解锁
D销毁
答案：D
18
____执行pthread_sem_post操作,当前线程会唤醒阻塞线程。
A当信号量已加锁时
B当信号量为0时
C当信号量已超过阈值时
D当信号量已销毁时
答案：B
19
一个AVX寄存器最多存放____个双精度浮点数。
A "#include "
B "#pragma omp parallel"
C "#ifdef _OPENMP"
D "#define _OPENMP"
答案：C
30
在使用条件变量之前必须对其进行____。
A初始化
B加锁
C解锁
D销毁
答案：A
31
采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1
行的优点是____。
A更有利于负载均衡
B减少了通信开销
C降低了计算次数
D减少了从进程空闲
答案：B
32
以下超级计算机中,____是SIMD架构。
A CRAY-1
B天河1A
C天河2号
D神威.太湖之光
答案：A
33
对划分输入数据的策略,下面说法错误的是____。
A当输出数据很少时，需划分输入数据
B当输出数据存在依赖时，需划分输入数据
C通常最后需要汇总结果
D由于不是直接划分输出数据，性能会很差
答案：D
34
实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是____。
A omp parallel
B omp barrier
C omp critical
D omp reduce
答案：C
35
for (i=2; i<10; i++) A[i] = A[i-2]+1;此循环____数据依赖。
A将空间离散化为网格
B在网络上进行局部计算
C局部计算结果完全独立
D重复若干时间步
答案：C
12
当前CPU性能提升已从依赖时钟频率提升转为更多依赖____。
A多核和众核技术
B突破物理局限
C改善散热
D采用新材料
答案：A
13
我国最近一次夺得全球超级计算机计算能力冠军的是____。
A天河1号
B天河1A
C天河2号
D神威.太湖之光
答案：D
14
对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一
个元素,这种说法是____。
A正确的
B错误的
答案：B
15
MPI组通信操作不包括哪类____。
A通信
B同步
C点对点
D计算
答案：C
16
对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。