-
题名基于长种子的二代测序序列找全比对算法
- 1
-
-
作者
吴邪
刘欢
徐云
-
机构
中国科学技术大学计算机科学与技术学院
安徽省高性能计算重点实验室
-
出处
《计算机系统应用》
2022年第10期310-316,共7页
-
基金
国家自然科学基金(61672480)
-
文摘
主流的二代测序序列找全比对算法采用种子扩展的方法,由于长种子索引存在空间开销大或检索时间长的问题,这类算法大多使用短种子而导致候选位置过多,增加了比对的时间成本.为此,提出一种基于长种子的找全比对算法,设计了一种空间开销低和检索时间适度的长种子哈希索引,其通过模运算限制哈希空间并使用布隆过滤器识别同一存储位置上的不同种子.长种子显著减少候选位置数量,从而降低验证阶段的时间开销.实验结果表明,在人类基因序列测序数据集上,该算法维持同等精度的同时比现有主流算法时间效率更高.
-
关键词
二代测序
找全比对算法
种子扩展
布隆过滤器
长种子
-
Keywords
next-generation sequencing
all-mapper
seed-and-extend
Bloom filter
long seed
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
Q811.4
[生物学—生物工程]
-