期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种字符串近似匹配的安全查询协议 被引量:2
1
作者 袁先平 仲红 +1 位作者 黄宏升 易磊 《计算机工程》 CAS CSCD 北大核心 2011年第20期142-144,共3页
数据库中字符串近似匹配查询不能完全保护查询双方的隐私信息。针对该问题,提出一种对数据库中字符串数据的近似匹配查询协议。采用安全计算编辑距离协议、同态加密、茫然传输等安全技术,在有效保护查询双方隐私信息的情况下,实现对字... 数据库中字符串近似匹配查询不能完全保护查询双方的隐私信息。针对该问题,提出一种对数据库中字符串数据的近似匹配查询协议。采用安全计算编辑距离协议、同态加密、茫然传输等安全技术,在有效保护查询双方隐私信息的情况下,实现对字符串近似匹配的查询,并分析该协议的正确性、安全性及复杂性,结果表明,该方案是安全有效的。 展开更多
关键词 字符串近似匹配 茫然传输 同态加密 编辑距离 隐私保护
下载PDF
基于字符串近似匹配的模式生成算法
2
作者 孙进 龚沛曾 《福建电脑》 2010年第2期59-61,共3页
本文提出一种字符串之间的模式产生算法。算法的思想来源于一个新颖的想法:通过比较两个字符串,得到两个字符串的不同之处,并采用一套事先定义的规则来泛化这些不同之处,从而得到一个能够同时匹配这两个字符串的模式,我们使用正规表达... 本文提出一种字符串之间的模式产生算法。算法的思想来源于一个新颖的想法:通过比较两个字符串,得到两个字符串的不同之处,并采用一套事先定义的规则来泛化这些不同之处,从而得到一个能够同时匹配这两个字符串的模式,我们使用正规表达式来表示这个模式。为了计算两个字符串的不同之处,本文使用了字符串近似匹配的方法,并提出了一种基于动态规划的改进算法,降低了已有算法的时空复杂度。 展开更多
关键词 模式生成 字符串近似匹配 数据抽取
下载PDF
基于过滤的中文多模式近似字符串匹配算法 被引量:5
3
作者 范立新 谢晓能 吴飞 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期48-50,58,共4页
当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算... 当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算法的有效性。 展开更多
关键词 近似字符串匹配 中文字符串匹配 多模式匹配 位并行运算 过滤
下载PDF
改进的中文近似字符串匹配算法 被引量:8
4
作者 范立新 《计算机工程与应用》 CSCD 北大核心 2006年第34期172-174,207,共4页
BPM-BM算法在针对汉字等大字符集的近似字符串匹配时取得了很好的实际效果,但该算法在最差情况下的总体时间复杂度为O(!+nm)。而提出的IBPM-BM算法由于具有记忆的能力,保证了过滤阶段的无回溯,可以在理论上保证最差情况下的总体时间复... BPM-BM算法在针对汉字等大字符集的近似字符串匹配时取得了很好的实际效果,但该算法在最差情况下的总体时间复杂度为O(!+nm)。而提出的IBPM-BM算法由于具有记忆的能力,保证了过滤阶段的无回溯,可以在理论上保证最差情况下的总体时间复杂度为O(!+n),而在最佳情况下的时间复杂度与BPM-BM算法一致。 展开更多
关键词 近似字符串匹配 位并行运算 过滤 编辑距离 中文字符串匹配
下载PDF
基于BPM-BM过滤优化的近似字符串匹配算法 被引量:1
5
作者 石永革 张毫 《青岛科技大学学报(自然科学版)》 CAS 2016年第1期108-112,共5页
BPM-BM算法结合位并行和过滤技术,是当前近似字符串匹配算法中效率最高的算法之一。算法中过滤机制容易导致位并行计算连续性中断,使位并行计算回溯导致性能大幅降低。针对此问题提出了基于过滤优化的BPM-BM算法。实验结果表明:优化算... BPM-BM算法结合位并行和过滤技术,是当前近似字符串匹配算法中效率最高的算法之一。算法中过滤机制容易导致位并行计算连续性中断,使位并行计算回溯导致性能大幅降低。针对此问题提出了基于过滤优化的BPM-BM算法。实验结果表明:优化算法在大字符集环境下继承了BPM-BM算法的运行高效性,在非大字符集环境下较BPM-BM算法提升显著,且随着编辑距离的增长,其时间开销增长的稳定性大幅优于BPM-BM算法。 展开更多
关键词 近似字符串匹配 BPM-BM算法 位并行 过滤
下载PDF
基于分层存储理论模型的近似字符串匹配并行算法研究
6
作者 满都呼 宋展 《集成技术》 2016年第1期33-43,共11页
CUDA(Compute Unified Device Architecture)是一种重要的并行处理架构,但其具有相对复杂的线程管理机制和多重存储模块,从而使得基于CUDA的算法时间复杂度很难量化。针对这一问题,提出了一种分层存储理论模型—HMM(Hierarchical Memory... CUDA(Compute Unified Device Architecture)是一种重要的并行处理架构,但其具有相对复杂的线程管理机制和多重存储模块,从而使得基于CUDA的算法时间复杂度很难量化。针对这一问题,提出了一种分层存储理论模型—HMM(Hierarchical Memory Machine)模型,该模型所具有的分层存储结构可以有效地描述图形处理单元设备不同存储模块的物理特性,因此非常适用于对CUDA算法时间复杂度的量化评估。作为HMM模型的应用实例,文章提出了一种基于HMM模型的并行近似字符串匹配算法,并给出了相应算法时间复杂度的计算过程。与串行算法相比,该算法可以获得60倍以上的加速比。 展开更多
关键词 近似字符串匹配 分层存储理论模型 并行算法 CUDA
下载PDF
一种带有长度和位置约束的字符串索引方法
7
作者 于长永 高明 +1 位作者 柏禄一 赵宇海 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第7期959-963,共5页
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和... 提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接. 展开更多
关键词 BWT 字符串索引 倒排链表 字符串近似匹配 序列比对
下载PDF
基于网络内容的无阻塞近似流分类的并行建模
8
作者 李旭东 徐扬 +1 位作者 李竞 刘斌 《计算机研究与发展》 EI CSCD 北大核心 2005年第6期938-944,共7页
针对大字符集语言的特点,提出一种并行硬件模型实现基于网络内容的近似流分类.由于采用并行设计和流水线设计,该模型在大规则库下仍有较好的性能,并可适用于高速网络.该并行模型有如下特点:①通过采用不同的规则组合器可完成插入、删除... 针对大字符集语言的特点,提出一种并行硬件模型实现基于网络内容的近似流分类.由于采用并行设计和流水线设计,该模型在大规则库下仍有较好的性能,并可适用于高速网络.该并行模型有如下特点:①通过采用不同的规则组合器可完成插入、删除、替代和交换错误的近似匹配;②通过配置参数,可灵活控制近似匹配的程度;③可直接应用于大字符集语言下的网络内容流分类;④针对中文环境做了概率建模,分析了并行硬件模型对网络分组的匹配概率,证明该模型在一般情况下具有较好的可应用性. 展开更多
关键词 基于内容的流分类 近似字符串匹配 并行建模
下载PDF
空间数据上Top-k关键词模糊查询算法 被引量:15
9
作者 胡骏 范举 +1 位作者 李国良 陈姗姗 《计算机学报》 EI CSCD 北大核心 2012年第11期2237-2246,共10页
基于位置的服务(LBS)变得日益普及,越来越多的研究开始关注如何对空间中的兴趣点(POI)做有效的检索.现有的方法提出了空间数据上的关键词检索,研究如何根据查询的位置和关键词找到相关的POI点.然而,现有方法主要对查询关键词进行精确匹... 基于位置的服务(LBS)变得日益普及,越来越多的研究开始关注如何对空间中的兴趣点(POI)做有效的检索.现有的方法提出了空间数据上的关键词检索,研究如何根据查询的位置和关键词找到相关的POI点.然而,现有方法主要对查询关键词进行精确匹配,不能支持模糊查询:当查询关键词与底层数据存在微小差异的时候,LBS系统不能返回相关的结果.为了满足移动用户的模糊查询需求,文中对空间数据上的Top-k关键词模糊查询问题进行研究:给定一组POI点,检索与查询关键词近似匹配且空间上距离相近的Top-k个结果.为了提供高效的模糊查询,文中首先定义了一种新型的相关性函数,综合考虑了文本相似性和空间距离,进而提出了一种有效的索引结构RegionTrie,并基于RegionTrie设计了高效的Top-k算法.真实数据集上的实验结果表明,文中提出的Top-k算法十分高效,性能远好于对比方法. 展开更多
关键词 基于位置的服务 空间数据上的关键词检索 字符串近似匹配
下载PDF
支持块编辑距离的索引结构 被引量:3
10
作者 王斌 郭庆 +1 位作者 李中博 杨晓春 《计算机研究与发展》 EI CSCD 北大核心 2010年第1期191-199,共9页
在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性.如何有效地支持块编辑距离,进行近似字符串查询处理具有重要的意义.计算两个字符串的块编辑距离是一... 在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性.如何有效地支持块编辑距离,进行近似字符串查询处理具有重要的意义.计算两个字符串的块编辑距离是一个NP完全问题,因此希望提供有效的方法可以增强过滤能力,并减少假通过率.设计了一种支持移动编辑距离的新颖的索引结构SHV-Trie,通过研究移动编辑距离的操作特性,使用字母出现的频率作为支持移动编辑距离操作的一个下界,并且提出相应的查询过滤算法,同时,针对索引SHV-Trie的空间开销过大的问题,提出一种优化字母排列的索引结构和一种压缩的索引结构及相关查询过滤算法.真实数据集上的实验结果与分析显示了所提出的索引结构具有良好的过滤能力,并通过减少效率假通过率提高查询的效率. 展开更多
关键词 近似字符串匹配 块编辑距离 压缩 索引 NP完全问题
下载PDF
一种可扩展的格式化文件内容检查方法
11
作者 高宁 庞立会 《计算机工程与科学》 CSCD 北大核心 2012年第6期32-37,共6页
许多业务应用系统将数据以约定格式存放在文件中,通过文件传输实现远距离业务数据传送和处理。通过分析该类业务应用系统存在的安全威胁,本文首次提出了一种可扩展的格式化文件内容检查方法,设计并实现了格式化文件内容检查的原型系统FF... 许多业务应用系统将数据以约定格式存放在文件中,通过文件传输实现远距离业务数据传送和处理。通过分析该类业务应用系统存在的安全威胁,本文首次提出了一种可扩展的格式化文件内容检查方法,设计并实现了格式化文件内容检查的原型系统FFC-CIS。FFC-CIS使用正则表达式构造内容格式模板,在业务系统的数据处理之前实现文件内容的安全检查,很好地消除了数据文件被恶意篡改、非法文件传递等安全威胁。为了使内容格式模板的构建快速而便捷,本文还给出了一个基于字符串近似匹配技术的内容格式模板自动生成方法。 展开更多
关键词 正则表达式 字符串近似匹配 格式化文件 模式自动生成 可扩展
下载PDF
基于内容的音频检索算法 被引量:2
12
作者 尚永强 张琳梅 徐大伟 《河南科技学院学报》 2009年第3期69-72,共4页
介绍了基于内容的音频检索系统的基本结构,并在研究国内外相关文献的基础上,分析了音频检索算法的主要特点,划分为以下几种类型:近似字符串匹配算法、基于树结构的音频检索算法、基于动态时间规整的音频检索算法、基于隐马尔克夫模型的... 介绍了基于内容的音频检索系统的基本结构,并在研究国内外相关文献的基础上,分析了音频检索算法的主要特点,划分为以下几种类型:近似字符串匹配算法、基于树结构的音频检索算法、基于动态时间规整的音频检索算法、基于隐马尔克夫模型的音频检索算法以及其它音频检索算法. 展开更多
关键词 音频检索 近似字符串匹配 动态时间规整 隐马尔可夫模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部