期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于k-mer词频向量的九种DNA序列相似性计算方法比较分析
1
作者 张小丹 李喆 +3 位作者 卫泽刚 刘策 余凯哲 魏月华 《科学技术创新》 2023年第21期106-111,共6页
序列相似性计算是生物序列分析的前提和基础,传统的序列相似性分析方法需要借助双序列比对,如Needleman-Wunsch(NW)序列比对算法。面对海量序列数据,基于序列比对的相似性计算方法具有较高的时间复杂度。为快速得到序列间相似性,可以通... 序列相似性计算是生物序列分析的前提和基础,传统的序列相似性分析方法需要借助双序列比对,如Needleman-Wunsch(NW)序列比对算法。面对海量序列数据,基于序列比对的相似性计算方法具有较高的时间复杂度。为快速得到序列间相似性,可以通过提取序列k-mer信息,利用序列k-mer词频向量进行计算。本文从序列k-mer词频向量提取及基于k-mer词频向量的九种相似性计算方法进行了详细介绍,并用两种数据集进行了比较分析。实验结果表明,基于k-mer词频相似性计算方法比标准NW算法速度至少快103倍,但不同的k-mer词频计算方法得到的相似性与标准NW算法差别较大,相对而言,欧式距离在两个数据集的相似性结果与NW方法更接近,在计算大规模序列相似性时,可以作为优先选择的方法。 展开更多
关键词 非序列对比 k-mer词频 Needleman-Wunsch算法 序列相似性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部