基于CUDA的生物序列数据算术编码并行压缩

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于CUDA的生物序列数据算术编码并行压缩
许俊富;谢江;顾永立;束俊辉;项超娟;张武
【期刊名称】《计算机应用与软件》
【年(卷),期】2016(033)012
【摘要】With the development of the next generation of bio-sequencing technology,files of biological sequence data become larger and larger.The compression of sequence data can reduce data storage space,however,it is difficult for traditional method to complete compression quickly.It is an important direction of the current compression technology research to shorten the processing time of data compression.Thus,the parallel arithmetic coding compression is realized by using CUDA and combining characteristics of biological sequence data.Three parallel compression methods are compared and it is found that the method based on priority probabilities can achieve rapid compression of large-scale biological sequence data,in which the priori probabilities depend on the type of sequences such as species and databases.Experiments demonstrate that the compression of GPU parallel arithmetic encoding method based on priori probabilities not only has the greater time efficiency,but also has high compression ratio,which can address the problem of compressing large biological sequence files rapidly and efficiently.%随着下一代生物序列测序技术的发展,大文件生物序列数据越来越常见。

虽然压缩序列数据能减少数据存储空间,但是传统的数据压缩的方法很难快速完成大规模的序列压缩,因此如何
缩短数据压缩时间是当前压缩技术研究的一个重要方向。

采用CUDA 技术实现算术编码,分析核苷酸生物序列数据特性,给出不同物种及数据库生物序列数据集中核苷酸的分布概率,提出并比较三种并行压缩方法,指出先验概率的并行压缩方法具有更好的压缩性能。

实验结果表明,先验概率的并行压缩方法不仅具有较高的时间效率,而且也能保持较高的数据压缩率,能较好地解决大规模生物序列文件的高效快速压缩问题。

【总页数】5页(P26-29,83)
【作者】许俊富;谢江;顾永立;束俊辉;项超娟;张武
【作者单位】上海大学计算机工程与科学学院上海200444;上海大学计算机工程与科学学院上海200444;上海众恒信息产业股份有限公司上海200000;上海大学计算机工程与科学学院上海200444;上海大学计算机工程与科学学院上海200444;上海大学计算机工程与科学学院上海200444
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于MPI+CUDA的异构并行可压缩流求解器 [J], 刘枫;李桦;田正雨;潘沙
2.基于CUDA的海洋监测数据并行压缩技术研究 [J], 李浩琦;王海斌;汪俊;
3.基于CUDA的压缩感知重构算法并行化研究 [J], 董蕾;黄方;卜栓栓;冯杰;周纪
4.基于CUDA的海洋监测数据并行压缩技术研究 [J], 李浩琦;王海斌;汪俊
5.CUDA并行数据压缩技术研究 [J], 程思远; 米婷; 吴宇亮; 杜江斌
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档