Matlab使用GPU并行加速方法

合集下载

Matlab使用GPU并行加速方法
GPU具有十分强大的数值计算能力，它使用大规模并行方式进行加速。

Matlab是十分重要的数学语言，矩阵计算十分方便。

但是Matlab是解释型语言，执行相对较慢。

我们可以使用GPU对Matlab进行加速。

Matlab调用GPU加速方法很多，主要有：
1 在GPU上执行重载的MATLAB函数
1.1最简单的编程模式
对GPU上已加载数据的Matlab函数直接调用。

Matlab已经重载了很多GPU 标准函数。

优点
①用户可以决定何时在Matlab工作区和GPU之间移动数据或创建存储在GPU内存中的数据，以尽可能减少主机与设备间数据传输的开销。

②用户可在同一函数调用中将在GPU上加载的数据和Matlab工作区中的数据混合，以实现最优的灵活性与易用性。

③这种方法提供了一个简单的接口，让用户可以在GPU上直接执行标准函数，从而获得性能提升，而无需花费任何时间开发专门的代码。

缺点
①在这种情况下，用户不得对函数进行任何更改，只能指定何时从GPU内存移动和检索数据，这两种操作分别通过gpuArray和gather命令来完成。

用户可以定义Matlab函数，执行对GPU上的数据的标量算术运算。

使用这种方法，用户可以扩展和自定义在GPU上执行的函数集，以构建复杂应用程序并实现性能加速。

这种方式需要进行的内核调用和数据传输比上述方法少。

优点
①这种编程模式允许用算术方法定义要在GPU上执行的复杂内核，只需使用Matlab语言即可。

②使用这种方法，可在GPU上执行复杂的算术运算，充分利用数据并行化并
最小化与内核调用和数据传输有关的开销。

缺点
①在这种情况下，用户不得对函数进行任何更改，只能指定何时从GPU内存移动和检索数据以及使用arrayfun命令调用函数。

函数会在GPU矢量的各个元素上执行，充分利用数据并行化。

1.3直接从Matlab调用CUDA代码
为了进一步扩展在GPU上执行的集合函数，可以从CUDA代码中创建一个Matlab可调用的GPU内核。

第三种编程模式可以让用户轻松地从Matlab直接调用已有CUDA代码，使非CUDA专家同样能够进行代码重用。

优点
①这种编程模式提供了直接从Matlab进行CUDA代码测试的整体解决方案，
无需使用GPU在环配置进行基于文件的数据交换。

②用户还可以直接从Matlab控制有关线程块大小和共享内存的参数。

缺点
①用户需要会CUDA编码。

2、Matlab与CUDA C混合编程
用Matlab与C/C++混合编程，采用动态链接库的方式产生可以供Matlab调用的.dll文件。

该方法使用CUDA C/C++语言编写在GPU上执行的代码，将之编译成.dll文件，然后使用C/C++语言编写mexFunction函数，在函数中加载使用CUDA的.dll文件，使用Matlab或者VC++编译mexFunction为另一个.dll文件。

最后在Matlab中调用含有mexFunction的.dll文件，执行GPU加速。

优点
十分灵活，可以将CUDA C/C++与Matlab相互调用，最大化计算性能。

缺点
编码要求较高，需要会CUDA C/C++语言及Matlab语言，还要会DLL编程及调用等。

（混合编程代码请去/s/1c08OMnI下载）。