-
题名串联重复序列比对的位置筛选方法
- 1
-
-
作者
温华铭
徐云
杨金宝
-
机构
中国科学技术大学计算机科学与技术学院
安徽省高性能计算重点实验室
华中农业大学信息学院
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第7期2160-2164,共5页
-
基金
国家自然科学基金面上项目(61672480)
国家外专局111引智计划资助项目(BP0719016)。
-
文摘
串联重复序列是基因组构建的困难片段,由于其重复单元之间的相似性与其拷贝数的不确定性,在序列比对时容易定位到多个候选位置,如何快速而准确地筛选出正确的比对位置是一项挑战。现有方法使用种子(从测序片段中选取的短序列)来定位并扩展候选比对位置,但挑选种子时未考虑串联重复序列特性。因此,提出了一种串联重复序列比对的位置筛选方法,其通过计算稀有kmer(长度为k的子序列)序列的相似性来筛选比对结果。此外,采用合并稀有kmer的策略加速计算,并利用基于编辑距离的模糊查找以提高过滤信息密度。实验结果表明,在模拟数据集上提高比对结果的召回率与准确率的同时,该方法比现有方法快约2倍,且具有良好的并行加速性能。
-
关键词
串联重复
单分子实时测序
序列比对
种子-扩展法
-
Keywords
tandem repeat
single molecule real-time sequencing
sequence alignment
seed-and-extend method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于低频种子的三代测序序列比对方法
被引量:1
- 2
-
-
作者
宋思怡
程昊宇
徐云
-
机构
中国科学技术大学计算机科学与技术学院
安徽省高性能计算重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第9期1551-1556,共6页
-
基金
国家自然科学基金(61672480)
-
文摘
随着测序技术的发展,三代测序已广泛应用于基因研究中。但是,由于三代测序序列具有平均长度长、错误率高的特性,如何快速、准确地将测序片段比对到参考基因组上成为严峻挑战。现有方法使用种子(从测序片段中挑选的短序列)来加速比对过程,但在挑选时未考虑频率特性,导致定位候选区域阶段时间消耗较大。因此,提出了一种基于低频种子的三代测序序列比对方法,该方法采用种子投票策略,使用低频种子进行投票,减少投票计数的时间消耗,并根据位置及票数关系对候选区域进行再过滤,进一步提高比对速度。实验结果表明,在确保敏感性和准确率的同时,本文方法比现有方法快3倍左右。
-
关键词
三代测序
单分子实时测序
序列比对
种子-扩展法
-
Keywords
third-generation sequencing
single molecule real-time sequencing
sequence alignment
seed-and-extend method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-