-
题名高通量测序中序列拼接算法的研究进展
被引量:6
- 1
-
-
作者
周卫星
石海鹤
-
机构
江西师范大学计算机信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2019年第5期36-43,共8页
-
基金
国家自然科学基金项目(61662035
61762049
+1 种基金
61862033)
江西省自然科学基金项目(20171BAB202013)资助
-
文摘
高通量测序(High-throughput Sequencing,HTS)技术是继第一代测序技术之后发展起来的一种新型测序方式,又被称为下一代测序技术。与第一代测序技术中采用基于Sanger方法的自动、半自动毛细管测序方法不同,高通量测序技术采用了基于焦磷酸测序的并行测序技术,是对传统测序技术的一项重要技术突破,它不仅克服了第一代测序技术高成本、低通量、低速度的缺点,而且能满足现代分子生物学和基因组学快速发展的需求,达到低成本、高通量以及快速的目的。相较于第一代测序数据,高通量测序数据具有典型的长度短、覆盖度不均匀以及准确率低的特点,同时第三代测序技术虽保持了高通量测序技术边测序边合成的思想,但采用了更为高效的单分子实时测序技术和纳米孔测序技术,具有高通量、低成本和测序数据长的优势。因此,要获得完整的全基因组基因序列,生物学家就需要使用一种技术将短测序reads拼装成一条完整的基因单链序列。在这种情况下,序列拼接算法应运而生。首先,介绍了序列拼接算法的发展背景以及高通量测序技术的相关概念,分析了高通量测序技术在序列拼接算法中所具有的优势;其次,通过总结序列拼接算法的发展成果,按基于greedy策略、基于Overlap-Layout-Consensus (OLC)策略和基于De Bruijn Graph (DBG)策略的分类对序列拼接算法进行阐述;最后,探讨了序列拼接算法的相关研究方向和发展趋势。
-
关键词
高通量测序技术
序列拼接算法
GREEDY
Overlap-Layout-Consensus
De
Bruijn
GRAPH
-
Keywords
High-throughput sequencing
Sequence assembly algorithms
Greedy
Overlap-layout-consensus
De bruijn graph
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-