期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种基于后缀排序快速实现Burrows-Wheeler变换的方法 被引量:3
1
作者 李冰 龙冰洁 刘勇 《电子与信息学报》 EI CSCD 北大核心 2015年第2期504-508,共5页
近年来,Bzip2压缩算法凭借其在压缩率方面的优势,得到了越来越多的应用,Bzip2的核心算法是Burrows-Wheeler变换(BWT),BWT能有效的将数据中相同的字符聚集到一起,为进一步压缩创造条件。在硬件实现BWT时,常用的基于后缀排序的算法能有效... 近年来,Bzip2压缩算法凭借其在压缩率方面的优势,得到了越来越多的应用,Bzip2的核心算法是Burrows-Wheeler变换(BWT),BWT能有效的将数据中相同的字符聚集到一起,为进一步压缩创造条件。在硬件实现BWT时,常用的基于后缀排序的算法能有效克服BWT消耗存储资源大的问题,该文对基于后缀排序实现BWT的方法进行了详细分析,并且在此基础上提出了一种快速实现BWT的方法后缀段算法。仿真结果表明后缀段算法在处理速度上比传统的基于后缀排序的算法有很大的提高。 展开更多
关键词 信号处理 数据压缩 Bzip2 burrows-wheeler变换 后缀排序
下载PDF
一种基于MPM和BWT算法的XML文档压缩方法 被引量:1
2
作者 陈国胜 《安徽工业大学学报(自然科学版)》 CAS 2009年第3期300-303,共4页
XML文档在网络存储和交换应用中被广泛采用,但是其冗余量大、占用空间和带宽多的缺点也给其应用带来了一定的阻碍。提出了一种将MPM算法(Multilevel Pattern Matching)和BWT(Burrows-Wheeler Transform)算法相结合来压缩XML文档的压缩方... XML文档在网络存储和交换应用中被广泛采用,但是其冗余量大、占用空间和带宽多的缺点也给其应用带来了一定的阻碍。提出了一种将MPM算法(Multilevel Pattern Matching)和BWT(Burrows-Wheeler Transform)算法相结合来压缩XML文档的压缩方法,给出了算法的详细描述。通过实验同其它压缩算法进行了比较,证明该方法是科学和高效的。 展开更多
关键词 XML文档 压缩方法 MPM bwt
下载PDF
采用BWT的多核并行的子串匹配算法
3
作者 王佳英 王斌 +1 位作者 李晓华 杨晓春 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第5期624-628,共5页
针对P-BWT精确匹配算法存在只支持短串查询并且只能工作在单处理器上的问题,提出了一个多核并行的支持任意查询长度的精确查询算法.改进了P-BWT索引上的查询过程,当一个查询串跨越了多个数据分片时,首先在其匹配的最后一个分片上查询,... 针对P-BWT精确匹配算法存在只支持短串查询并且只能工作在单处理器上的问题,提出了一个多核并行的支持任意查询长度的精确查询算法.改进了P-BWT索引上的查询过程,当一个查询串跨越了多个数据分片时,首先在其匹配的最后一个分片上查询,然后依次在前面分片上进行验证.进一步提出了一个多核并行查询算法来减少搜索和验证过程的迭代次数.实验结果表明,所述算法可以高效并行地完成子串匹配任务. 展开更多
关键词 bwt 全文索引 精确匹配 并行 多核
下载PDF
BWT-Boyer-Moore压缩域搜索算法的研究
4
作者 姚全珠 丁晓剑 +1 位作者 任雪利 张志锋 《计算机应用研究》 CSCD 北大核心 2006年第7期59-61,共3页
针对Boyer-Moore匹配算法对压缩文本文件搜索的不足,分析了当前对于压缩文件搜索的主要方法,提出了一种基于BW转换的高效的搜索算法并予以验证。
关键词 压缩域 BOYER-MOORE算法 Burrow-wheeler转换
下载PDF
序列比对算法BWA的优化
5
作者 胡爽 陈长波 《计算机应用研究》 CSCD 北大核心 2024年第12期3777-3785,共9页
序列比对是基因组数据分析的关键一环,提高其比对效率对推动测序技术在医学、古生物学等领域的应用具有重要意义。针对BWA算法两大步骤之一的SAMSE存在冗余读取索引导致效率欠佳的问题,提出了新的算法BWA^(*)。其通过运用流程优化消除了... 序列比对是基因组数据分析的关键一环,提高其比对效率对推动测序技术在医学、古生物学等领域的应用具有重要意义。针对BWA算法两大步骤之一的SAMSE存在冗余读取索引导致效率欠佳的问题,提出了新的算法BWA^(*)。其通过运用流程优化消除了SAMSE中参考序列及其索引的冗余读取,在此基础上叠加运用关键参数值调整和多线程优化等技术,进一步提高了计算效率。公开数据库中的真实序列测试表明,BWA^(*)的SAMSE步骤的性能是BWA中SAMSE性能的7.11~8.61倍,平均为7.84倍,BWA^(*)的整体性能是BWA的1.25~1.70倍,平均1.47倍。针对实际应用中的古代DNA序列比对,实验表明和另一常用工具BWA-MEM相比,优化后的BWA^(*)在继承原有BWA高精度特性的同时,实现了对BWA-MEM速度的超越。 展开更多
关键词 序列比对 罗伯斯-惠勒变换 第二代测序 BWA 古代DNA
下载PDF
一种灵活的精度可控的可搜索对称加密方案 被引量:3
6
作者 李西明 陶汝裕 +2 位作者 粟晨 黄琼 黄欣沂 《计算机研究与发展》 EI CSCD 北大核心 2020年第1期3-16,共14页
中查找到关键词记录的这3种搜索情况.同时,系统也结合3种搜索设计了一种模糊增强搜索进一步增强系统的实用性.FASSE方案的具体实现语言是Java编程开发语言,并且最终实验得出FASSE在https://eprint.iacr.org/complete/的论文数据集中平... 中查找到关键词记录的这3种搜索情况.同时,系统也结合3种搜索设计了一种模糊增强搜索进一步增强系统的实用性.FASSE方案的具体实现语言是Java编程开发语言,并且最终实验得出FASSE在https://eprint.iacr.org/complete/的论文数据集中平均搜索完每一篇论文的时间为114.26ms. 展开更多
关键词 可搜索对称加密 后缀数组 LF映射 SubLF映射 FM索引 bwt转换
下载PDF
一组整数的几个实用编码方案
7
作者 杨胜天 仇佩亮 《通信学报》 EI CSCD 北大核心 2005年第7期1-7,共7页
以Golomb码和扩展Gamma码为基础提出了4种针对一组整数的编码方案。这些方案增强了对低熵值整数序列的压缩性能,同时仍保持了整数码低复杂性的特点。通过应用这些编码方案,设计了一个基于Burrows-Wheeler变换的压缩算法。该算法的实验... 以Golomb码和扩展Gamma码为基础提出了4种针对一组整数的编码方案。这些方案增强了对低熵值整数序列的压缩性能,同时仍保持了整数码低复杂性的特点。通过应用这些编码方案,设计了一个基于Burrows-Wheeler变换的压缩算法。该算法的实验结果表明其压缩比率要优于采用整数码的BWT类压缩算法。 展开更多
关键词 信息论 通用数据压缩 整数编码:Golomb码 扩展Gamma码 burrows-wheeler变换
下载PDF
序列比对算法中的BW变换索引技术研究及其改进 被引量:3
8
作者 赵雅男 徐云 程昊宇 《计算机工程》 CAS CSCD 北大核心 2016年第1期282-286,共5页
面向大规模长序列的序列比对问题是生物信息学中最重要的基础问题之一。针对序列比对算法的主流索引技术BW变换(BWT)进行研究,提出一种新的二阶BWT索引方法。与传统BWT方法的逐位索引查找不同,改进后的BWT方法按双位索引查找。实验结果... 面向大规模长序列的序列比对问题是生物信息学中最重要的基础问题之一。针对序列比对算法的主流索引技术BW变换(BWT)进行研究,提出一种新的二阶BWT索引方法。与传统BWT方法的逐位索引查找不同,改进后的BWT方法按双位索引查找。实验结果表明,改进后的方法减少了序列比对算法中的循环遍历和计算次数,降低了序列比对算法中索引方法的复杂度,提高了查找效率,尤其适合长序列和大规模序列的索引和查找。 展开更多
关键词 序列比对 索引 BW变换索引 第二代测序 第三代测序 大规模长序列比对
下载PDF
基于码书索引变换的高通量DNA序列数据压缩算法 被引量:1
9
作者 谭丽 孙季丰 《电子学报》 EI CAS CSCD 北大核心 2015年第5期1007-1013,共7页
提出一种高通量DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行... 提出一种高通量DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行块排序压缩变换(BWT),最后进行前移编码变换和Huffman熵编码.在多种测序数据集上的实验结果表明,CITD在大多数情况下可以获得比本文所对比的高通量DNA专用压缩方法更优的压缩性能. 展开更多
关键词 高通量DNA序列 码书索引变换模型 块排序压缩变换 前移编码 信息熵 数据压缩算法
下载PDF
基于比特平面SBI变换的遥感图像无损压缩
10
作者 苏东卫 慈林林 陈晓峰 《北京理工大学学报》 EI CAS CSCD 北大核心 2005年第9期765-768,共4页
提出一种基于子块互换(subb lock in terchange,SB I)的遥感图像无损压缩方案.采用小波变换对遥感图像进行分解,将生成的频域数据按不同比特平面分别进行SB I变换并用算术编码进行压缩.该方案改进了基于列的扫描方式,将小波系数按幅值... 提出一种基于子块互换(subb lock in terchange,SB I)的遥感图像无损压缩方案.采用小波变换对遥感图像进行分解,将生成的频域数据按不同比特平面分别进行SB I变换并用算术编码进行压缩.该方案改进了基于列的扫描方式,将小波系数按幅值大小进行重新排序,根据SB I变换后数据特点取消了文本压缩中常用的前移编码(M TF),在降低复杂度的前提下提高了压缩率,同时具有信噪比和分辨率可扩展特性. 展开更多
关键词 遥感图像 比特平面编码 bwt算法 SBI变换 排序顺序
下载PDF
一种带有长度和位置约束的字符串索引方法
11
作者 于长永 高明 +1 位作者 柏禄一 赵宇海 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第7期959-963,共5页
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和... 提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接. 展开更多
关键词 bwt 字符串索引 倒排链表 字符串近似匹配 序列比对
下载PDF
Clustering and presorting for parallel burrows wheeler-based compression
12
作者 Sergey Voronin Eugene Borovikov Raqibul Hasan 《International Journal of Modeling, Simulation, and Scientific Computing》 EI 2021年第6期75-88,共14页
We describe practical improvements for parallel BWT-based lossless compressors frequently utilized in modern day big data applications.We propose a clustering-based data permutation approach for improving compression... We describe practical improvements for parallel BWT-based lossless compressors frequently utilized in modern day big data applications.We propose a clustering-based data permutation approach for improving compression ratio for data with significant alphabet variation along with a faster string sorting approach based on the application of the O(n)complexity counting sort with permutation reindexing. 展开更多
关键词 Lossless data compression burrowswheeler transform data permutation fast string sorting
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部