期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
高错误率长序列的高敏感度比对 被引量:1
1
作者 罗贤橦 钟诚 黎瑶 《小型微型计算机系统》 CSCD 北大核心 2020年第11期2442-2448,共7页
将第三代测序平台产生的高错误率的长序列(long read)与参考基因组进行映射比对,需要高的编辑距离阈值.为此种求解长序列比对问题,将高错误率的长序列分割成较短的片段,借鉴全映射比对的思想,寻找所有满足编辑距离阈值的序列片段的候选... 将第三代测序平台产生的高错误率的长序列(long read)与参考基因组进行映射比对,需要高的编辑距离阈值.为此种求解长序列比对问题,将高错误率的长序列分割成较短的片段,借鉴全映射比对的思想,寻找所有满足编辑距离阈值的序列片段的候选位置;采用对高编辑距离更敏感的基于Hash索引的变长种子播种算法,定位序列片段在参考基因组上的候选位置,将连续“插入删除”相同碱基的编辑距离设置为1,使得算法可以处理第三代测序数据中新出现的“均聚物(homopolymer)”类型错误,以提升序列比对的敏感度;对片段侯选位置数量进行统计分析,求出片段候选位置质量分数,过滤掉质量不高的片段侯选位置;根据序列片段间的位置关系,动态连接片段的侯选位置,连接时对不同错误类型给予不同罚分,以去除假阳性的候选位置,确保比对的准确度.在模拟和真实数据集上的实验结果表明,与同类方法相比,本文方法在获得相同高的准确度的同时,提升了比对查全率和敏感度. 展开更多
关键词 长序列比对 高错误率 分割映射 编辑距离 敏感度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部