OpenCL例程使用手册

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图3
使用SSH拷贝到开发板,注意,需先要在开发板上ping一下Ubuntu的IP,再进行拷贝:
图4
Target#ifconfig//查询开发板IP
图5
在Ubuntu上拷贝解压出来的opencl文件夹到开发板。
Host#scp -r openclroot@192.168.1.37:/home/root
2.3
源码路径:光盘资料/demo/OpenCL/bin/opencl.tar.gz
本文已经提供编译好的OpenCL例程,将它拷贝Ubuntu解压并拷贝到开发板文件系统上即可执行,或者自行拷贝上一步骤编译的文件也可以。
解压opencl.tar.gz:
Host#tar axvfopencl.tar.gz
2
2.1
此工具用于后面步骤拷贝文件到开发板,在Ubuntu下安装:
Host#sudoapt-get install gawk
图1
2.2
请先安装ti-processor-sdk,进入sdk根目录
Host#make opencl-examples
图2
编译成功后,会在“example-applications/opencl-examples-1.1.10.3”目录生成可执行文件。
OpenCL例程使用手册
1
OpenCL(全称Open Computing Language,开放运算语言)是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景。
Target./vecadd_openmp
图9
3.3
例程分别在ARM端(两个OpenMP线程)和DSP端(OpenCL加速)进行浮点计算,数据量为2*1024*1024个。
进入开发板“/opencl/float_compute”,执行程序:
Target./float_compute
图10
由运行结果可以看出ARM端用时8379us,DSP端用时7702us。
3.4
FFT运算
进入开发板“/opencl/dsplib_fft”执行程序:
Target./dsplib_fft
图11
3.5
进入开发板“/opencl/monte_carlo”执行程序:
Target./monte_carlo
图12
图13
图6
即可在开发板上看到拷贝过去的opencl文件:
图7
3
3.1
进入开发板“/pencl/vecadd”,执行程序:
Target./vecadd
图8
例程运行结果为:8192K个元素的两个四维向量相加,用时26549us。
3.2
例程是使用OpenMP并行进行向量(8192个元素、一维向量)相加。
进入开发板“/opencl/vecadd_openmp”,执行程序:
相关文档
最新文档