-
题名基于MapReduce的基因读段定位算法
被引量:2
- 1
-
-
作者
涂金金
杨明
郭丽娜
-
机构
南京师范大学计算机科学与技术学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第3期206-212,共7页
-
基金
国家自然科学基金项目(No.61272222
61003116)
+2 种基金
江苏省自然科学基金重点重大专项项目(No.BK2011005)
江苏省自然科学基金项目(No.BK2011782)
江苏省普通高校研究生科研创新计划项目(No.CXLX12_0415)资助
-
文摘
RNA-seq测序技术的高速发展所产生的海量数据在执行效率上给原有读段定位算法带来严峻的挑战.为此,提出基于MapReduce的不跨越剪切位的空位种子索引算法(PSeqMap)和跨越剪切位的空位种子索引算法(PJuncSeqMap),以及一种负载平衡解决方案.该算法利用MapReduce框架实现空位种子索引算法的并行化,在拟南芥菜基因数据集上的实验结果表明文中提出的算法能够充分利用集群的存储和计算能力,高效处理海量基因数据.
-
关键词
读段定位
seqmap
MAPREDUCE
-
Keywords
Read Mapping, seqmap, MapReduce
-
分类号
Q75
[生物学—分子生物学]
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于MapReduce的基因读段定位改进算法
被引量:1
- 2
-
-
作者
涂金金
杨明
郭丽娜
-
机构
南京师范大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2015年第8期82-85,共4页
-
基金
国家自然科学基金(61272222
61003116)
+2 种基金
江苏省自然科学基金重点重大专项(BK2011005)
江苏省自然科学基金(BK2011782)
江苏省普通高校研究生科研创新计划项目(CXLX12_0415)资助
-
文摘
由于高通量测序技术产生了海量基因读段数据,并行的基因读段定位算法成为近年来的研究热点。对基因匹配算法进行研究,提出了一种基于MapReduce的基因读段定位改进算法,并且通过在读段定位过程中融入生物信息以及利用Hadoop分布式缓存机制,在一定程度上降低了算法的复杂度。在拟南芥菜基因数据集上进行的实验表明,该算法能够有效提高算法执行效率,减少算法执行时间。
-
关键词
读段定位
MAPREDUCE
seqmap
-
Keywords
Read mapping, MapReduce, seqmap
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-