序列拼接是生物信息学的基础问题.全面总结了面向下一代测序技术的de novo DNA序列拼接工具,介绍下一代测序平台产生的数据特点以及de novo序列拼接算法所面临的挑战;给出序列拼接算法的形式化定义,总结目前最常用的拼接策略以及根据相...序列拼接是生物信息学的基础问题.全面总结了面向下一代测序技术的de novo DNA序列拼接工具,介绍下一代测序平台产生的数据特点以及de novo序列拼接算法所面临的挑战;给出序列拼接算法的形式化定义,总结目前最常用的拼接策略以及根据相应策略开发的拼接工具的特点和实现细节;对评估拼接性能的主要参数进行描述,并通过不同物种、不同规模的真实基因组序列数据对多个具有代表性的拼接工具进行测试,比较它们的拼接性能以验证相应的工具特点.为研究人员提供工具选择指导或改善拼接工具性能提供帮助;最后总结并阐述序列拼接工具存在的问题和发展趋势.展开更多
文摘序列拼接是生物信息学的基础问题.全面总结了面向下一代测序技术的de novo DNA序列拼接工具,介绍下一代测序平台产生的数据特点以及de novo序列拼接算法所面临的挑战;给出序列拼接算法的形式化定义,总结目前最常用的拼接策略以及根据相应策略开发的拼接工具的特点和实现细节;对评估拼接性能的主要参数进行描述,并通过不同物种、不同规模的真实基因组序列数据对多个具有代表性的拼接工具进行测试,比较它们的拼接性能以验证相应的工具特点.为研究人员提供工具选择指导或改善拼接工具性能提供帮助;最后总结并阐述序列拼接工具存在的问题和发展趋势.