期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
采用BWT的多核并行的子串匹配算法
1
作者
王佳英
王斌
+1 位作者
李晓华
杨晓春
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016年第5期624-628,共5页
针对P-BWT精确匹配算法存在只支持短串查询并且只能工作在单处理器上的问题,提出了一个多核并行的支持任意查询长度的精确查询算法.改进了P-BWT索引上的查询过程,当一个查询串跨越了多个数据分片时,首先在其匹配的最后一个分片上查询,...
针对P-BWT精确匹配算法存在只支持短串查询并且只能工作在单处理器上的问题,提出了一个多核并行的支持任意查询长度的精确查询算法.改进了P-BWT索引上的查询过程,当一个查询串跨越了多个数据分片时,首先在其匹配的最后一个分片上查询,然后依次在前面分片上进行验证.进一步提出了一个多核并行查询算法来减少搜索和验证过程的迭代次数.实验结果表明,所述算法可以高效并行地完成子串匹配任务.
展开更多
关键词
bwt
全文索引
精确匹配
并行
多核
下载PDF
职称材料
压缩的全文自索引算法研究
被引量:
2
2
作者
路炜
刘燕兵
+2 位作者
王春露
刘庆云
郭莉
《计算机应用与软件》
CSCD
北大核心
2014年第3期11-15,35,共6页
针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空...
针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空间。综述现有的十几种典型的压缩的全文自索引算法的基本思想及其实现,并在多种数据集上对这些算法进行综合的测试评估。实验结果表明,压缩的全文自索引技术有效地节省了空间开销,实用价值较高。
展开更多
关键词
全文索引
数据压缩
自索引
后缀数组
bwt
变换
下载PDF
职称材料
一种灵活的精度可控的可搜索对称加密方案
被引量:
3
3
作者
李西明
陶汝裕
+2 位作者
粟晨
黄琼
黄欣沂
《计算机研究与发展》
EI
CSCD
北大核心
2020年第1期3-16,共14页
中查找到关键词记录的这3种搜索情况.同时,系统也结合3种搜索设计了一种模糊增强搜索进一步增强系统的实用性.FASSE方案的具体实现语言是Java编程开发语言,并且最终实验得出FASSE在https://eprint.iacr.org/complete/的论文数据集中平...
中查找到关键词记录的这3种搜索情况.同时,系统也结合3种搜索设计了一种模糊增强搜索进一步增强系统的实用性.FASSE方案的具体实现语言是Java编程开发语言,并且最终实验得出FASSE在https://eprint.iacr.org/complete/的论文数据集中平均搜索完每一篇论文的时间为114.26ms.
展开更多
关键词
可搜索对称加密
后缀数组
LF映射
SubLF映射
FM索引
bwt
转换
下载PDF
职称材料
序列比对算法中的BW变换索引技术研究及其改进
被引量:
3
4
作者
赵雅男
徐云
程昊宇
《计算机工程》
CAS
CSCD
北大核心
2016年第1期282-286,共5页
面向大规模长序列的序列比对问题是生物信息学中最重要的基础问题之一。针对序列比对算法的主流索引技术BW变换(BWT)进行研究,提出一种新的二阶BWT索引方法。与传统BWT方法的逐位索引查找不同,改进后的BWT方法按双位索引查找。实验结果...
面向大规模长序列的序列比对问题是生物信息学中最重要的基础问题之一。针对序列比对算法的主流索引技术BW变换(BWT)进行研究,提出一种新的二阶BWT索引方法。与传统BWT方法的逐位索引查找不同,改进后的BWT方法按双位索引查找。实验结果表明,改进后的方法减少了序列比对算法中的循环遍历和计算次数,降低了序列比对算法中索引方法的复杂度,提高了查找效率,尤其适合长序列和大规模序列的索引和查找。
展开更多
关键词
序列比对
索引
BW变换索引
第二代测序
第三代测序
大规模长序列比对
下载PDF
职称材料
基于码书索引变换的高通量DNA序列数据压缩算法
被引量:
1
5
作者
谭丽
孙季丰
《电子学报》
EI
CAS
CSCD
北大核心
2015年第5期1007-1013,共7页
提出一种高通量DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行...
提出一种高通量DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行块排序压缩变换(BWT),最后进行前移编码变换和Huffman熵编码.在多种测序数据集上的实验结果表明,CITD在大多数情况下可以获得比本文所对比的高通量DNA专用压缩方法更优的压缩性能.
展开更多
关键词
高通量DNA序列
码书索引变换模型
块排序压缩变换
前移编码
信息熵
数据压缩算法
下载PDF
职称材料
一种带有长度和位置约束的字符串索引方法
6
作者
于长永
高明
+1 位作者
柏禄一
赵宇海
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第7期959-963,共5页
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和...
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接.
展开更多
关键词
bwt
字符串索引
倒排链表
字符串近似匹配
序列比对
下载PDF
职称材料
基于模拟后缀数组索引结构的实现
7
作者
杨炜鸿
张毅
于洪梅
《情报科学》
CSSCI
北大核心
2009年第12期1834-1836,1862,共4页
实现了一种基于模拟后缀数组的索引的结构,并在实现索引功能的同时对索引结构进行有效压缩。首先,对传统的哈夫曼编码压缩小波树时出现的空白编码进行了处理,应用正则哈夫曼编码有效的去掉了空白编码;其次,通过相关函数操作在已压缩的...
实现了一种基于模拟后缀数组的索引的结构,并在实现索引功能的同时对索引结构进行有效压缩。首先,对传统的哈夫曼编码压缩小波树时出现的空白编码进行了处理,应用正则哈夫曼编码有效的去掉了空白编码;其次,通过相关函数操作在已压缩的小波树上模拟实现了后缀数组功能。理论分析和实验结果表明,这种结构具有很小的空间占用,并不影响索引结构的运行效率。
展开更多
关键词
全文索引
后缀数组
BW变换
哈夫曼编码
原文传递
题名
采用BWT的多核并行的子串匹配算法
1
作者
王佳英
王斌
李晓华
杨晓春
机构
东北大学计算机科学与工程学院
出处
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016年第5期624-628,共5页
基金
国家自然科学基金资助项目(61322208
61272178
+3 种基金
61129002
61572122
61532021)
教育部高等学校博士学科点专项科研基金资助项目(20110042110028)
文摘
针对P-BWT精确匹配算法存在只支持短串查询并且只能工作在单处理器上的问题,提出了一个多核并行的支持任意查询长度的精确查询算法.改进了P-BWT索引上的查询过程,当一个查询串跨越了多个数据分片时,首先在其匹配的最后一个分片上查询,然后依次在前面分片上进行验证.进一步提出了一个多核并行查询算法来减少搜索和验证过程的迭代次数.实验结果表明,所述算法可以高效并行地完成子串匹配任务.
关键词
bwt
全文索引
精确匹配
并行
多核
Keywords
bwt
(
burrows-wheeler
transform
)
full text
index
exact matching
parallel
multi-core
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
压缩的全文自索引算法研究
被引量:
2
2
作者
路炜
刘燕兵
王春露
刘庆云
郭莉
机构
北京邮电大学计算机学院
河北师范大学附属民族学院
中国科学院信息工程研究所信息内容安全技术国家工程实验室
出处
《计算机应用与软件》
CSCD
北大核心
2014年第3期11-15,35,共6页
基金
国家自然科学基金项目(61202477)
国家高技术研究发展计划项目(2011AA010703)
+1 种基金
中国科学院战略性先导专项(XD06030602)
河北省教育厅科研项目(QN20131164)
文摘
针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空间。综述现有的十几种典型的压缩的全文自索引算法的基本思想及其实现,并在多种数据集上对这些算法进行综合的测试评估。实验结果表明,压缩的全文自索引技术有效地节省了空间开销,实用价值较高。
关键词
全文索引
数据压缩
自索引
后缀数组
bwt
变换
Keywords
Full-text
index
Data compression Self-
index
Suffix array
bwt
transform
ation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种灵活的精度可控的可搜索对称加密方案
被引量:
3
3
作者
李西明
陶汝裕
粟晨
黄琼
黄欣沂
机构
华南农业大学数学与信息学院
福建师范大学数学与信息学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第1期3-16,共14页
基金
国家自然科学基金优秀青年科学基金项目(61822202)
国家自然科学基金项目(61872152,61872409)
+2 种基金
广东省自然科学基金杰出青年基金项目(2014A030306021)
广东省特支计划科技创新青年拔尖人才项目(2015TQ01X796)
广东省基础与应用基础研究重大项目(2019B030302008)This work was~~
文摘
中查找到关键词记录的这3种搜索情况.同时,系统也结合3种搜索设计了一种模糊增强搜索进一步增强系统的实用性.FASSE方案的具体实现语言是Java编程开发语言,并且最终实验得出FASSE在https://eprint.iacr.org/complete/的论文数据集中平均搜索完每一篇论文的时间为114.26ms.
关键词
可搜索对称加密
后缀数组
LF映射
SubLF映射
FM索引
bwt
转换
Keywords
searchable symmetric encryption(SSE)
suffix array(SA)
LF mapping
SubLF mapping
FM-
index
Burrows Wheeler
transform
(
bwt
)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
序列比对算法中的BW变换索引技术研究及其改进
被引量:
3
4
作者
赵雅男
徐云
程昊宇
机构
中国科学技术大学计算机科学与技术学院
安徽省高性能计算重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第1期282-286,共5页
基金
国家自然科学基金资助重点项目(61033009)
国家"111"计划基金资助项目(B07033)
文摘
面向大规模长序列的序列比对问题是生物信息学中最重要的基础问题之一。针对序列比对算法的主流索引技术BW变换(BWT)进行研究,提出一种新的二阶BWT索引方法。与传统BWT方法的逐位索引查找不同,改进后的BWT方法按双位索引查找。实验结果表明,改进后的方法减少了序列比对算法中的循环遍历和计算次数,降低了序列比对算法中索引方法的复杂度,提高了查找效率,尤其适合长序列和大规模序列的索引和查找。
关键词
序列比对
索引
BW变换索引
第二代测序
第三代测序
大规模长序列比对
Keywords
sequence alignment
index
burrows-wheeler transform(bwt) index
next-generation sequencing
third generation sequencing
alignment of large-scale and long sequences
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于码书索引变换的高通量DNA序列数据压缩算法
被引量:
1
5
作者
谭丽
孙季丰
机构
华南理工大学电子与信息学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2015年第5期1007-1013,共7页
基金
国家自然科学基金青年科学基金(No.61202292)
广东省自然科学基金(No.9151064101000037)
文摘
提出一种高通量DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行块排序压缩变换(BWT),最后进行前移编码变换和Huffman熵编码.在多种测序数据集上的实验结果表明,CITD在大多数情况下可以获得比本文所对比的高通量DNA专用压缩方法更优的压缩性能.
关键词
高通量DNA序列
码书索引变换模型
块排序压缩变换
前移编码
信息熵
数据压缩算法
Keywords
high-throughput DNA sequence
codebook
index
transform
ation (CIT)model
burrow wheeler transfarmation
(bwt
)
move to front(MTF)
information entropy
data compression algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种带有长度和位置约束的字符串索引方法
6
作者
于长永
高明
柏禄一
赵宇海
机构
东北大学秦皇岛分校计算机与通信工程学院
东北大学计算机科学与工程学院
出处
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第7期959-963,共5页
基金
国家自然科学基金资助项目(61772124
61332014
+4 种基金
61401080
61402087)
河北省自然科学基金资助项目(F2015501049)
河北省教育厅项目(QN2014339)
中央高校基本科研业务费专项资金资助项目(N150402002)
文摘
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接.
关键词
bwt
字符串索引
倒排链表
字符串近似匹配
序列比对
Keywords
bwt
(
burrows-wheeler
-
transform
)
string
index
inverted list
string similarity match
sequence alignment
分类号
TP311.131 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于模拟后缀数组索引结构的实现
7
作者
杨炜鸿
张毅
于洪梅
机构
吉林工商学院信息工程分院
吉林大学网络中心
出处
《情报科学》
CSSCI
北大核心
2009年第12期1834-1836,1862,共4页
基金
吉林省教育厅科技规划项目(2007248
2008257)
文摘
实现了一种基于模拟后缀数组的索引的结构,并在实现索引功能的同时对索引结构进行有效压缩。首先,对传统的哈夫曼编码压缩小波树时出现的空白编码进行了处理,应用正则哈夫曼编码有效的去掉了空白编码;其次,通过相关函数操作在已压缩的小波树上模拟实现了后缀数组功能。理论分析和实验结果表明,这种结构具有很小的空间占用,并不影响索引结构的运行效率。
关键词
全文索引
后缀数组
BW变换
哈夫曼编码
Keywords
full text
index
suffix arrays
bwt
transform
huffman code.
分类号
G354 [文化科学—情报学]
TP311 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
采用BWT的多核并行的子串匹配算法
王佳英
王斌
李晓华
杨晓春
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016
0
下载PDF
职称材料
2
压缩的全文自索引算法研究
路炜
刘燕兵
王春露
刘庆云
郭莉
《计算机应用与软件》
CSCD
北大核心
2014
2
下载PDF
职称材料
3
一种灵活的精度可控的可搜索对称加密方案
李西明
陶汝裕
粟晨
黄琼
黄欣沂
《计算机研究与发展》
EI
CSCD
北大核心
2020
3
下载PDF
职称材料
4
序列比对算法中的BW变换索引技术研究及其改进
赵雅男
徐云
程昊宇
《计算机工程》
CAS
CSCD
北大核心
2016
3
下载PDF
职称材料
5
基于码书索引变换的高通量DNA序列数据压缩算法
谭丽
孙季丰
《电子学报》
EI
CAS
CSCD
北大核心
2015
1
下载PDF
职称材料
6
一种带有长度和位置约束的字符串索引方法
于长永
高明
柏禄一
赵宇海
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
0
下载PDF
职称材料
7
基于模拟后缀数组索引结构的实现
杨炜鸿
张毅
于洪梅
《情报科学》
CSSCI
北大核心
2009
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部