Matlab使用GPU并行加速方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Matlab使用GPU并行加速方法
GPU具有十分强大的数值计算能力,它使用大规模并行方式进行加速。
Matlab是十分重要的数学语言,矩阵计算十分方便。
但是Matlab是解释型语言,执行相对较慢。
我们可以使用GPU对Matlab进行加速。
Matlab调用GPU加速方法很多,主要有:
1 在GPU上执行重载的MATLAB函数
1.1最简单的编程模式
对GPU上已加载数据的Matlab函数直接调用。
Matlab已经重载了很多GPU 标准函数。
优点
①用户可以决定何时在Matlab工作区和GPU之间移动数据或创建存储在GPU内存中的数据,以尽可能减少主机与设备间数据传输的开销。
②用户可在同一函数调用中将在GPU上加载的数据和Matlab工作区中的数据混合,以实现最优的灵活性与易用性。
③这种方法提供了一个简单的接口,让用户可以在GPU上直接执行标准函数,从而获得性能提升,而无需花费任何时间开发专门的代码。
缺点
①在这种情况下,用户不得对函数进行任何更改,只能指定何时从GPU内存移动和检索数据,这两种操作分别通过gpuArray和gather命令来完成。
用户可以定义Matlab函数,执行对GPU上的数据的标量算术运算。
使用这种方法,用户可以扩展和自定义在GPU上执行的函数集,以构建复杂应用程序并实现性能加速。
这种方式需要进行的内核调用和数据传输比上述方法少。
优点
①这种编程模式允许用算术方法定义要在GPU上执行的复杂内核,只需使用Matlab语言即可。
②使用这种方法,可在GPU上执行复杂的算术运算,充分利用数据并行化并
最小化与内核调用和数据传输有关的开销。
缺点
①在这种情况下,用户不得对函数进行任何更改,只能指定何时从GPU内存移动和检索数据以及使用arrayfun命令调用函数。
函数会在GPU矢量的各个元素上执行,充分利用数据并行化。
1.3直接从Matlab调用CUDA代码
为了进一步扩展在GPU上执行的集合函数,可以从CUDA代码中创建一个Matlab可调用的GPU内核。
第三种编程模式可以让用户轻松地从Matlab直接调用已有CUDA代码,使非CUDA专家同样能够进行代码重用。
优点
①这种编程模式提供了直接从Matlab进行CUDA代码测试的整体解决方案,
无需使用GPU在环配置进行基于文件的数据交换。
②用户还可以直接从Matlab控制有关线程块大小和共享内存的参数。
缺点
①用户需要会CUDA编码。
2、Matlab与CUDA C混合编程
用Matlab与C/C++混合编程,采用动态链接库的方式产生可以供Matlab调用的.dll文件。
该方法使用CUDA C/C++语言编写在GPU上执行的代码,将之编译成.dll文件,然后使用C/C++语言编写mexFunction函数,在函数中加载使用CUDA的.dll文件,使用Matlab或者VC++编译mexFunction为另一个.dll文件。
最后在Matlab中调用含有mexFunction的.dll文件,执行GPU加速。
优点
十分灵活,可以将CUDA C/C++与Matlab相互调用,最大化计算性能。
缺点
编码要求较高,需要会CUDA C/C++语言及Matlab语言,还要会DLL编程及调用等。
(混合编程代码请去/s/1c08OMnI下载)。