基于 OpenCL 的双 GPU 基数排序算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于 OpenCL 的双 GPU 基数排序算法
赵成龙;施慧彬;俞忻峰
【期刊名称】《计算机与现代化》
【年(卷),期】2015(000)001
【摘要】In order to improve resource utilization rate and algorithm acceleration ratio of radix sort on heterogeneous parallel plat -form, this thesis proposed the implementation of dual GPU radix sort algorithm based on OpenCL .Through research the idea of parallel radix sort , this thesis uses Y485 P as exprimental platform , firstly realizes the radix sort on single GPU based on OpenCL , then realizes the radix sort on dual GPU by load balancing .Test results show that when using single GPU , the speedup is 1.3x, using dual GPU is 2.32x.%为提高基数排序算法在异构并行平台下的资源利用率和算法加速比,提出基于OpenCL的双GPU基数排序算法。
通过研究并行基数排序思想,以Y485 P作为实验平台,使用OpenCL技术首先实现单GPU的基数排序算法,之后实现负载平衡的双GPU基数排序。
测试结果表明,在使用单GPU时加速比为1.3x,使用双GPU时加速比为2.32x。
【总页数】4页(P27-30)
【作者】赵成龙;施慧彬;俞忻峰
【作者单位】南京航空航天大学计算机科学与技术学院,江苏南京 210016;南京航空航天大学计算机科学与技术学院,江苏南京 210016;南京理工大学计算机科学与工程学院,江苏南京 210094
【正文语种】中文
【中图分类】TP302
【相关文献】
1.基于CPU与GPU/OpenCL的快速傅里叶变换的实现和性能比较 [J], 刘勇;苏军
2.一种基于OpenCL的高能效并行KNN算法及其GPU验证 [J], 贺江;蒲宇亮;李海波;阎波
3.基于结构特征的身份证号码基数排序算法研究 [J], 柳小文;雷军程
4.基于OpenCL的隐马尔可夫模型的GPU并行实现 [J], 刘华泓;姜克旺;蔡向高
5.基于OpenCL机器视觉算法GPU实现 [J], 吴进;刘应;刘镇弢;李乔深
因版权原因,仅展示原文概要,查看原文内容请购买。