-
题名下一代测序数据格式的研究展望
- 1
-
-
作者
鲍婧
-
机构
厦门大学信息科学与技术学院
-
出处
《电脑知识与技术》
2011年第12X期9316-9317,9337,共3页
-
文摘
该文主要讲述随着下一代测序技术(next-generation sequencing)的快速发展,生物信息数据产生了大量的小片段序列。像re-sequencing还有transcriptome sequencing测序产生的数据中,都会产生定位在参考基因组上的短序列片段。如何有效地对测序数据进行针对性的短序列片段映射及比对处理,是个值得关注的问题。SAM和BAM格式是用于存储对参考序列的片段比对的一个通用比对格式,BAM含有和SAM相同的信息,而BAM较高的压缩率也为存储数据带来便利,同时它也具有快速访问和检索的功能。能够能直接或间接支持SAM/BAM数据格式的基因浏览器可以实现快速浏览,为后续可视化及注释的处理带来极大的便利。基于SAM/BAM的灵活性和可扩展性,该文提出一种可以将SAM/BAM格式的数据作为基因浏览器数据层的实现方法,这将极大地提高了基因浏览器对下一代测序数据的展示效果,也同时推进了测序数据可视化的发展。
-
关键词
测序数据处理
序列比对格式
SAMtools
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
-