-
题名高通量DNA测序数据的多任务并行压缩算法
被引量:2
- 1
-
-
作者
何娜
李家辉
王婷
罗海飚
-
机构
广州中国科学院软件应用技术研究所并行软件研发中心
中国科学院软件研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第7期2014-2017,共4页
-
基金
广州市云计算技术研发及产业化专项基金资助项目(2013Y2-00076)
-
文摘
研究采用任务并行的方法,对Fast Q格式文件的压缩程序DSRC(DNA sequence reads compression)进行了加速。这一任务并行算法将DSRC分为数据读入和数据压缩两个独立的任务,而后将数据压缩的统计过程进一步细分为title行数据统计和其他数据统计两个独立任务。研究结合CPU多线程、GPU、MIC(many integrated core),针对title行数据设计了高并行度的统计算法,实现title行数据的并行统计。在维持原有压缩比的情况下,本研究得到的最大压缩通量可以达到144 MBps,最大加速比可达三倍。结果表明,多任务并行的方法可以有效地加速DSRC,而协处理器对DSRC的加速效果并不明显。另外本算法在压缩ILLUMINA和SOLi D测序平台下的Fast Q数据时,其加速效果比压缩LS454测序平台的数据更为明显。
-
关键词
多任务并行
多线程
GPU
MIC
FastQ文件
压缩
-
Keywords
muhi-task parallel
multithread
GPU
MIC
FastQ format file
compression
-
分类号
TP311.56
[自动化与计算机技术—计算机软件与理论]
TP301.6
[自动化与计算机技术—计算机系统结构]
-