基于TI6678多核DSP的OpenCV并行优化

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于TI6678多核DSP的OpenCV并行优化
李津;罗昕颉;扈啸;陈跃跃
【期刊名称】《计算机工程与科学》
【年(卷),期】2018(040)005
【摘要】数字信号处理器(DSP)广泛应用于各类工业领域和军事装备领
域,OpenCV是业界通用的开源图像处理算法库,但目前鲜有针对DSP平台的OpenCV移植和优化实现.在TI 6678平台上实现了OpenCV的移植,生成了支持绝大多数OpenCV功能的TI 6678底层支持库.在此基础上,深入分析了一类OpenCV库函数在TI 6678硬件平台运行的计算特征和数据流,提出了一种针对这类OpenCV库函数的优化方法,将TI 6678体系结构支持的DMA和Cache操作与OpenMP并行框架高效结合,实现这类OpenCV库函数在TI 6678芯片上的优化和多核并行.依据本文的方法,优化改造的OpenCV库函数在TI 6678上单核运行性能最多可提升3.6倍,在单核优化基础上并行改造的这类库函数8核加速比达到2.55~7.06.%Digital Signal Processing (DSP) is widely used in various industrial fields and military equipment fields.OpenCV is a common open source image processing algorithm library.However,there are few implementations for OpenCV transplantation and optimization on DSP platforms.In this paper,OpenCV is successfully transplanted on a
TMS320C6678 DSP platform and generates an underlying support library with most functions preserved.Based on this,we deeply analyze the computational features and data flow of some OpenCV library functions running on this platform.As a result,an optimization method for these
OpenCV library functions is proposed.This method combines DMA,Cache operations and OpenMP parallel frameworks,which are supported by TI 6678 architecture.According to this method,we implement the optimization and multi-core parallelism for a class of OpenCV library functions on the TI 6678 chip.With the help of our method,the optimized OpenCV library function running on a single core of TI 6678 chip can be speeded up by up to 3.6 times.On this basis,we parallelize this class of library functions on 8 cores,obtaining the speedup of 2.55 to 7.06.
【总页数】7页(P780-786)
【作者】李津;罗昕颉;扈啸;陈跃跃
【作者单位】国防科技大学计算机学院,湖南长沙 410073;北京大学信息科学技术学院,北京 100871;国防科技大学计算机学院,湖南长沙 410073;国防科技大学计算机学院,湖南长沙 410073
【正文语种】中文
【中图分类】TP311.54
【相关文献】
1.基于多核DSP的激光点云解算算法并行设计 [J], 牛京玉;胡坚;孟凡荣;贺文静
2.基于多核DSP的H.264图像压缩编码的并行化实现 [J], 李素钧;廖胜;李强
3.基于多核DSP的SAR数据并行访问研究 [J], 周峰;李健
4.基于多核DSP的星载并行遥感图像压缩系统设计与实现 [J], 唐国斐;周海芳;谭庆平
5.一种基于多核DSP的穿墙雷达成像算法的并行实现 [J], 张晨华;欧阳缮;叶金才;马荣华;王鲁豫
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档