期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于模式物种的快速同源搜索软件基准测试
1
作者 王殷伟 武晶菁 +3 位作者 张宸宁 华宜家 李鹏 严洁 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期44-51,80,共9页
传统的blast+软件包中的blastp搜索,在大数据时代下,序列搜索速度已经慢得难以接受.同源搜索软件的开发在过去十几年取得了巨大进展,但缺乏综合的评估.本研究对7个快速同源搜索软件与blastp进行了综合比较,结果发现,diamond的fast模式... 传统的blast+软件包中的blastp搜索,在大数据时代下,序列搜索速度已经慢得难以接受.同源搜索软件的开发在过去十几年取得了巨大进展,但缺乏综合的评估.本研究对7个快速同源搜索软件与blastp进行了综合比较,结果发现,diamond的fast模式总体上来说相比其他软件更快,并且有着最低的错误发现率,是追求快速搜索的最佳选择;在内存消耗上,MMseqs2的算法在内存消耗上非常低,而ghostx则最高;在鉴定的hits数量方面,除了blasp以外,MMseqs2的s7.5模式在中等基因组相似度GSS下得到的结果最多,但s5模式应是更好的选择.随着GSS的降低,ghostx得到的结果最多,而随着GSS的升高,ublast得到的结果最多;在鉴定的Reciprocal Best Hits(RBH)数量上,ghostx在远缘搜索上具有优势,这一优势同样也具有共线性证据支持.在同源搜索方面,除ghostx有43.4%的额外结果外,几乎所有软件的搜索结果之间都有着很大的重叠,并且ghostx还有着非常低的错误发现率,而MMseqs2的s3模式却有着最高的错误发现率.总之,MMseqs2、diamond和ghostx是综合来说最好的三款替代blastp搜索的软件,diamond非常适合进行直系同源推断,并且可以用“fast”模式准确地快速搜索,而“very”是权衡下来最佳的搜索模式,但如果是进行远缘物种的搜索,ghostx则更有优势,而对于中等GSS下同源蛋白的鉴定,MMseqs2的s5可能是更好的选择. 展开更多
关键词 同源搜索 直系同源推断 RBH 快速算法 序列比较
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部