期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
采用BWT的多核并行的子串匹配算法
1
作者 王佳英 王斌 +1 位作者 李晓华 杨晓春 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第5期624-628,共5页
针对P-BWT精确匹配算法存在只支持短串查询并且只能工作在单处理器上的问题,提出了一个多核并行的支持任意查询长度的精确查询算法.改进了P-BWT索引上的查询过程,当一个查询串跨越了多个数据分片时,首先在其匹配的最后一个分片上查询,... 针对P-BWT精确匹配算法存在只支持短串查询并且只能工作在单处理器上的问题,提出了一个多核并行的支持任意查询长度的精确查询算法.改进了P-BWT索引上的查询过程,当一个查询串跨越了多个数据分片时,首先在其匹配的最后一个分片上查询,然后依次在前面分片上进行验证.进一步提出了一个多核并行查询算法来减少搜索和验证过程的迭代次数.实验结果表明,所述算法可以高效并行地完成子串匹配任务. 展开更多
关键词 bwt 全文索引 精确匹配 并行 多核
下载PDF
压缩的全文自索引算法研究 被引量:2
2
作者 路炜 刘燕兵 +2 位作者 王春露 刘庆云 郭莉 《计算机应用与软件》 CSCD 北大核心 2014年第3期11-15,35,共6页
针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空... 针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空间。综述现有的十几种典型的压缩的全文自索引算法的基本思想及其实现,并在多种数据集上对这些算法进行综合的测试评估。实验结果表明,压缩的全文自索引技术有效地节省了空间开销,实用价值较高。 展开更多
关键词 全文索引 数据压缩 自索引 后缀数组 bwt变换
下载PDF
一种灵活的精度可控的可搜索对称加密方案 被引量:3
3
作者 李西明 陶汝裕 +2 位作者 粟晨 黄琼 黄欣沂 《计算机研究与发展》 EI CSCD 北大核心 2020年第1期3-16,共14页
中查找到关键词记录的这3种搜索情况.同时,系统也结合3种搜索设计了一种模糊增强搜索进一步增强系统的实用性.FASSE方案的具体实现语言是Java编程开发语言,并且最终实验得出FASSE在https://eprint.iacr.org/complete/的论文数据集中平... 中查找到关键词记录的这3种搜索情况.同时,系统也结合3种搜索设计了一种模糊增强搜索进一步增强系统的实用性.FASSE方案的具体实现语言是Java编程开发语言,并且最终实验得出FASSE在https://eprint.iacr.org/complete/的论文数据集中平均搜索完每一篇论文的时间为114.26ms. 展开更多
关键词 可搜索对称加密 后缀数组 LF映射 SubLF映射 FM索引 bwt转换
下载PDF
序列比对算法中的BW变换索引技术研究及其改进 被引量:3
4
作者 赵雅男 徐云 程昊宇 《计算机工程》 CAS CSCD 北大核心 2016年第1期282-286,共5页
面向大规模长序列的序列比对问题是生物信息学中最重要的基础问题之一。针对序列比对算法的主流索引技术BW变换(BWT)进行研究,提出一种新的二阶BWT索引方法。与传统BWT方法的逐位索引查找不同,改进后的BWT方法按双位索引查找。实验结果... 面向大规模长序列的序列比对问题是生物信息学中最重要的基础问题之一。针对序列比对算法的主流索引技术BW变换(BWT)进行研究,提出一种新的二阶BWT索引方法。与传统BWT方法的逐位索引查找不同,改进后的BWT方法按双位索引查找。实验结果表明,改进后的方法减少了序列比对算法中的循环遍历和计算次数,降低了序列比对算法中索引方法的复杂度,提高了查找效率,尤其适合长序列和大规模序列的索引和查找。 展开更多
关键词 序列比对 索引 BW变换索引 第二代测序 第三代测序 大规模长序列比对
下载PDF
基于码书索引变换的高通量DNA序列数据压缩算法 被引量:1
5
作者 谭丽 孙季丰 《电子学报》 EI CAS CSCD 北大核心 2015年第5期1007-1013,共7页
提出一种高通量DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行... 提出一种高通量DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行块排序压缩变换(BWT),最后进行前移编码变换和Huffman熵编码.在多种测序数据集上的实验结果表明,CITD在大多数情况下可以获得比本文所对比的高通量DNA专用压缩方法更优的压缩性能. 展开更多
关键词 高通量DNA序列 码书索引变换模型 块排序压缩变换 前移编码 信息熵 数据压缩算法
下载PDF
一种带有长度和位置约束的字符串索引方法
6
作者 于长永 高明 +1 位作者 柏禄一 赵宇海 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第7期959-963,共5页
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和... 提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接. 展开更多
关键词 bwt 字符串索引 倒排链表 字符串近似匹配 序列比对
下载PDF
基于模拟后缀数组索引结构的实现
7
作者 杨炜鸿 张毅 于洪梅 《情报科学》 CSSCI 北大核心 2009年第12期1834-1836,1862,共4页
实现了一种基于模拟后缀数组的索引的结构,并在实现索引功能的同时对索引结构进行有效压缩。首先,对传统的哈夫曼编码压缩小波树时出现的空白编码进行了处理,应用正则哈夫曼编码有效的去掉了空白编码;其次,通过相关函数操作在已压缩的... 实现了一种基于模拟后缀数组的索引的结构,并在实现索引功能的同时对索引结构进行有效压缩。首先,对传统的哈夫曼编码压缩小波树时出现的空白编码进行了处理,应用正则哈夫曼编码有效的去掉了空白编码;其次,通过相关函数操作在已压缩的小波树上模拟实现了后缀数组功能。理论分析和实验结果表明,这种结构具有很小的空间占用,并不影响索引结构的运行效率。 展开更多
关键词 全文索引 后缀数组 BW变换 哈夫曼编码
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部