期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
12
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种字符串近似匹配的安全查询协议
被引量:
2
1
作者
袁先平
仲红
+1 位作者
黄宏升
易磊
《计算机工程》
CAS
CSCD
北大核心
2011年第20期142-144,共3页
数据库中字符串近似匹配查询不能完全保护查询双方的隐私信息。针对该问题,提出一种对数据库中字符串数据的近似匹配查询协议。采用安全计算编辑距离协议、同态加密、茫然传输等安全技术,在有效保护查询双方隐私信息的情况下,实现对字...
数据库中字符串近似匹配查询不能完全保护查询双方的隐私信息。针对该问题,提出一种对数据库中字符串数据的近似匹配查询协议。采用安全计算编辑距离协议、同态加密、茫然传输等安全技术,在有效保护查询双方隐私信息的情况下,实现对字符串近似匹配的查询,并分析该协议的正确性、安全性及复杂性,结果表明,该方案是安全有效的。
展开更多
关键词
字符串近似匹配
茫然传输
同态加密
编辑距离
隐私保护
下载PDF
职称材料
基于字符串近似匹配的模式生成算法
2
作者
孙进
龚沛曾
《福建电脑》
2010年第2期59-61,共3页
本文提出一种字符串之间的模式产生算法。算法的思想来源于一个新颖的想法:通过比较两个字符串,得到两个字符串的不同之处,并采用一套事先定义的规则来泛化这些不同之处,从而得到一个能够同时匹配这两个字符串的模式,我们使用正规表达...
本文提出一种字符串之间的模式产生算法。算法的思想来源于一个新颖的想法:通过比较两个字符串,得到两个字符串的不同之处,并采用一套事先定义的规则来泛化这些不同之处,从而得到一个能够同时匹配这两个字符串的模式,我们使用正规表达式来表示这个模式。为了计算两个字符串的不同之处,本文使用了字符串近似匹配的方法,并提出了一种基于动态规划的改进算法,降低了已有算法的时空复杂度。
展开更多
关键词
模式生成
字符串近似匹配
数据抽取
下载PDF
职称材料
基于过滤的中文多模式近似字符串匹配算法
被引量:
5
3
作者
范立新
谢晓能
吴飞
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第20期48-50,58,共4页
当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算...
当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算法的有效性。
展开更多
关键词
近似
字符串
匹配
中文
字符串
匹配
多模式
匹配
位并行运算
过滤
下载PDF
职称材料
改进的中文近似字符串匹配算法
被引量:
8
4
作者
范立新
《计算机工程与应用》
CSCD
北大核心
2006年第34期172-174,207,共4页
BPM-BM算法在针对汉字等大字符集的近似字符串匹配时取得了很好的实际效果,但该算法在最差情况下的总体时间复杂度为O(!+nm)。而提出的IBPM-BM算法由于具有记忆的能力,保证了过滤阶段的无回溯,可以在理论上保证最差情况下的总体时间复...
BPM-BM算法在针对汉字等大字符集的近似字符串匹配时取得了很好的实际效果,但该算法在最差情况下的总体时间复杂度为O(!+nm)。而提出的IBPM-BM算法由于具有记忆的能力,保证了过滤阶段的无回溯,可以在理论上保证最差情况下的总体时间复杂度为O(!+n),而在最佳情况下的时间复杂度与BPM-BM算法一致。
展开更多
关键词
近似
字符串
匹配
位并行运算
过滤
编辑距离
中文
字符串
匹配
下载PDF
职称材料
基于BPM-BM过滤优化的近似字符串匹配算法
被引量:
1
5
作者
石永革
张毫
《青岛科技大学学报(自然科学版)》
CAS
2016年第1期108-112,共5页
BPM-BM算法结合位并行和过滤技术,是当前近似字符串匹配算法中效率最高的算法之一。算法中过滤机制容易导致位并行计算连续性中断,使位并行计算回溯导致性能大幅降低。针对此问题提出了基于过滤优化的BPM-BM算法。实验结果表明:优化算...
BPM-BM算法结合位并行和过滤技术,是当前近似字符串匹配算法中效率最高的算法之一。算法中过滤机制容易导致位并行计算连续性中断,使位并行计算回溯导致性能大幅降低。针对此问题提出了基于过滤优化的BPM-BM算法。实验结果表明:优化算法在大字符集环境下继承了BPM-BM算法的运行高效性,在非大字符集环境下较BPM-BM算法提升显著,且随着编辑距离的增长,其时间开销增长的稳定性大幅优于BPM-BM算法。
展开更多
关键词
近似
字符串
匹配
BPM-BM算法
位并行
过滤
下载PDF
职称材料
基于分层存储理论模型的近似字符串匹配并行算法研究
6
作者
满都呼
宋展
《集成技术》
2016年第1期33-43,共11页
CUDA(Compute Unified Device Architecture)是一种重要的并行处理架构,但其具有相对复杂的线程管理机制和多重存储模块,从而使得基于CUDA的算法时间复杂度很难量化。针对这一问题,提出了一种分层存储理论模型—HMM(Hierarchical Memory...
CUDA(Compute Unified Device Architecture)是一种重要的并行处理架构,但其具有相对复杂的线程管理机制和多重存储模块,从而使得基于CUDA的算法时间复杂度很难量化。针对这一问题,提出了一种分层存储理论模型—HMM(Hierarchical Memory Machine)模型,该模型所具有的分层存储结构可以有效地描述图形处理单元设备不同存储模块的物理特性,因此非常适用于对CUDA算法时间复杂度的量化评估。作为HMM模型的应用实例,文章提出了一种基于HMM模型的并行近似字符串匹配算法,并给出了相应算法时间复杂度的计算过程。与串行算法相比,该算法可以获得60倍以上的加速比。
展开更多
关键词
近似
字符串
匹配
分层存储理论模型
并行算法
CUDA
下载PDF
职称材料
一种带有长度和位置约束的字符串索引方法
7
作者
于长永
高明
+1 位作者
柏禄一
赵宇海
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第7期959-963,共5页
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和...
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接.
展开更多
关键词
BWT
字符串
索引
倒排链表
字符串近似匹配
序列比对
下载PDF
职称材料
基于网络内容的无阻塞近似流分类的并行建模
8
作者
李旭东
徐扬
+1 位作者
李竞
刘斌
《计算机研究与发展》
EI
CSCD
北大核心
2005年第6期938-944,共7页
针对大字符集语言的特点,提出一种并行硬件模型实现基于网络内容的近似流分类.由于采用并行设计和流水线设计,该模型在大规则库下仍有较好的性能,并可适用于高速网络.该并行模型有如下特点:①通过采用不同的规则组合器可完成插入、删除...
针对大字符集语言的特点,提出一种并行硬件模型实现基于网络内容的近似流分类.由于采用并行设计和流水线设计,该模型在大规则库下仍有较好的性能,并可适用于高速网络.该并行模型有如下特点:①通过采用不同的规则组合器可完成插入、删除、替代和交换错误的近似匹配;②通过配置参数,可灵活控制近似匹配的程度;③可直接应用于大字符集语言下的网络内容流分类;④针对中文环境做了概率建模,分析了并行硬件模型对网络分组的匹配概率,证明该模型在一般情况下具有较好的可应用性.
展开更多
关键词
基于内容的流分类
近似
字符串
匹配
并行建模
下载PDF
职称材料
空间数据上Top-k关键词模糊查询算法
被引量:
15
9
作者
胡骏
范举
+1 位作者
李国良
陈姗姗
《计算机学报》
EI
CSCD
北大核心
2012年第11期2237-2246,共10页
基于位置的服务(LBS)变得日益普及,越来越多的研究开始关注如何对空间中的兴趣点(POI)做有效的检索.现有的方法提出了空间数据上的关键词检索,研究如何根据查询的位置和关键词找到相关的POI点.然而,现有方法主要对查询关键词进行精确匹...
基于位置的服务(LBS)变得日益普及,越来越多的研究开始关注如何对空间中的兴趣点(POI)做有效的检索.现有的方法提出了空间数据上的关键词检索,研究如何根据查询的位置和关键词找到相关的POI点.然而,现有方法主要对查询关键词进行精确匹配,不能支持模糊查询:当查询关键词与底层数据存在微小差异的时候,LBS系统不能返回相关的结果.为了满足移动用户的模糊查询需求,文中对空间数据上的Top-k关键词模糊查询问题进行研究:给定一组POI点,检索与查询关键词近似匹配且空间上距离相近的Top-k个结果.为了提供高效的模糊查询,文中首先定义了一种新型的相关性函数,综合考虑了文本相似性和空间距离,进而提出了一种有效的索引结构RegionTrie,并基于RegionTrie设计了高效的Top-k算法.真实数据集上的实验结果表明,文中提出的Top-k算法十分高效,性能远好于对比方法.
展开更多
关键词
基于位置的服务
空间数据上的关键词检索
字符串近似匹配
下载PDF
职称材料
支持块编辑距离的索引结构
被引量:
3
10
作者
王斌
郭庆
+1 位作者
李中博
杨晓春
《计算机研究与发展》
EI
CSCD
北大核心
2010年第1期191-199,共9页
在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性.如何有效地支持块编辑距离,进行近似字符串查询处理具有重要的意义.计算两个字符串的块编辑距离是一...
在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性.如何有效地支持块编辑距离,进行近似字符串查询处理具有重要的意义.计算两个字符串的块编辑距离是一个NP完全问题,因此希望提供有效的方法可以增强过滤能力,并减少假通过率.设计了一种支持移动编辑距离的新颖的索引结构SHV-Trie,通过研究移动编辑距离的操作特性,使用字母出现的频率作为支持移动编辑距离操作的一个下界,并且提出相应的查询过滤算法,同时,针对索引SHV-Trie的空间开销过大的问题,提出一种优化字母排列的索引结构和一种压缩的索引结构及相关查询过滤算法.真实数据集上的实验结果与分析显示了所提出的索引结构具有良好的过滤能力,并通过减少效率假通过率提高查询的效率.
展开更多
关键词
近似
字符串
匹配
块编辑距离
压缩
索引
NP完全问题
下载PDF
职称材料
一种可扩展的格式化文件内容检查方法
11
作者
高宁
庞立会
《计算机工程与科学》
CSCD
北大核心
2012年第6期32-37,共6页
许多业务应用系统将数据以约定格式存放在文件中,通过文件传输实现远距离业务数据传送和处理。通过分析该类业务应用系统存在的安全威胁,本文首次提出了一种可扩展的格式化文件内容检查方法,设计并实现了格式化文件内容检查的原型系统FF...
许多业务应用系统将数据以约定格式存放在文件中,通过文件传输实现远距离业务数据传送和处理。通过分析该类业务应用系统存在的安全威胁,本文首次提出了一种可扩展的格式化文件内容检查方法,设计并实现了格式化文件内容检查的原型系统FFC-CIS。FFC-CIS使用正则表达式构造内容格式模板,在业务系统的数据处理之前实现文件内容的安全检查,很好地消除了数据文件被恶意篡改、非法文件传递等安全威胁。为了使内容格式模板的构建快速而便捷,本文还给出了一个基于字符串近似匹配技术的内容格式模板自动生成方法。
展开更多
关键词
正则表达式
字符串近似匹配
格式化文件
模式自动生成
可扩展
下载PDF
职称材料
基于内容的音频检索算法
被引量:
2
12
作者
尚永强
张琳梅
徐大伟
《河南科技学院学报》
2009年第3期69-72,共4页
介绍了基于内容的音频检索系统的基本结构,并在研究国内外相关文献的基础上,分析了音频检索算法的主要特点,划分为以下几种类型:近似字符串匹配算法、基于树结构的音频检索算法、基于动态时间规整的音频检索算法、基于隐马尔克夫模型的...
介绍了基于内容的音频检索系统的基本结构,并在研究国内外相关文献的基础上,分析了音频检索算法的主要特点,划分为以下几种类型:近似字符串匹配算法、基于树结构的音频检索算法、基于动态时间规整的音频检索算法、基于隐马尔克夫模型的音频检索算法以及其它音频检索算法.
展开更多
关键词
音频检索
近似
字符串
匹配
动态时间规整
隐马尔可夫模型
下载PDF
职称材料
题名
一种字符串近似匹配的安全查询协议
被引量:
2
1
作者
袁先平
仲红
黄宏升
易磊
机构
安徽大学计算智能与信号处理教育部重点实验室
安徽大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第20期142-144,共3页
基金
国家自然科学基金资助项目(60773114)
安徽高校省级重点自然科学研究基金资助项目(KJ2010A009)
文摘
数据库中字符串近似匹配查询不能完全保护查询双方的隐私信息。针对该问题,提出一种对数据库中字符串数据的近似匹配查询协议。采用安全计算编辑距离协议、同态加密、茫然传输等安全技术,在有效保护查询双方隐私信息的情况下,实现对字符串近似匹配的查询,并分析该协议的正确性、安全性及复杂性,结果表明,该方案是安全有效的。
关键词
字符串近似匹配
茫然传输
同态加密
编辑距离
隐私保护
Keywords
string approximate matching
vacant transmission
homomorphism encryption
edit distance
privacy protection
分类号
TP393.08 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于字符串近似匹配的模式生成算法
2
作者
孙进
龚沛曾
机构
同济大学
出处
《福建电脑》
2010年第2期59-61,共3页
文摘
本文提出一种字符串之间的模式产生算法。算法的思想来源于一个新颖的想法:通过比较两个字符串,得到两个字符串的不同之处,并采用一套事先定义的规则来泛化这些不同之处,从而得到一个能够同时匹配这两个字符串的模式,我们使用正规表达式来表示这个模式。为了计算两个字符串的不同之处,本文使用了字符串近似匹配的方法,并提出了一种基于动态规划的改进算法,降低了已有算法的时空复杂度。
关键词
模式生成
字符串近似匹配
数据抽取
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
TP311.1 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于过滤的中文多模式近似字符串匹配算法
被引量:
5
3
作者
范立新
谢晓能
吴飞
机构
浙江大学计算机学院
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第20期48-50,58,共4页
文摘
当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算法的有效性。
关键词
近似
字符串
匹配
中文
字符串
匹配
多模式
匹配
位并行运算
过滤
Keywords
Approximate string match
Chinese string match
Multiple patterns match
Bit-parallel calculation
Filtering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
改进的中文近似字符串匹配算法
被引量:
8
4
作者
范立新
机构
绍兴文理学院计算机系
出处
《计算机工程与应用》
CSCD
北大核心
2006年第34期172-174,207,共4页
文摘
BPM-BM算法在针对汉字等大字符集的近似字符串匹配时取得了很好的实际效果,但该算法在最差情况下的总体时间复杂度为O(!+nm)。而提出的IBPM-BM算法由于具有记忆的能力,保证了过滤阶段的无回溯,可以在理论上保证最差情况下的总体时间复杂度为O(!+n),而在最佳情况下的时间复杂度与BPM-BM算法一致。
关键词
近似
字符串
匹配
位并行运算
过滤
编辑距离
中文
字符串
匹配
Keywords
approximate string matching
bit-parallel
filter
edit distance
chinese string matching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于BPM-BM过滤优化的近似字符串匹配算法
被引量:
1
5
作者
石永革
张毫
机构
南昌大学信息工程学院
出处
《青岛科技大学学报(自然科学版)》
CAS
2016年第1期108-112,共5页
基金
国家自然科学基金项目(61163005)
文摘
BPM-BM算法结合位并行和过滤技术,是当前近似字符串匹配算法中效率最高的算法之一。算法中过滤机制容易导致位并行计算连续性中断,使位并行计算回溯导致性能大幅降低。针对此问题提出了基于过滤优化的BPM-BM算法。实验结果表明:优化算法在大字符集环境下继承了BPM-BM算法的运行高效性,在非大字符集环境下较BPM-BM算法提升显著,且随着编辑距离的增长,其时间开销增长的稳定性大幅优于BPM-BM算法。
关键词
近似
字符串
匹配
BPM-BM算法
位并行
过滤
Keywords
approximate string match
BPM-BM algorithm
bit-parallel
filter
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于分层存储理论模型的近似字符串匹配并行算法研究
6
作者
满都呼
宋展
机构
中国科学院深圳先进技术研究院
出处
《集成技术》
2016年第1期33-43,共11页
文摘
CUDA(Compute Unified Device Architecture)是一种重要的并行处理架构,但其具有相对复杂的线程管理机制和多重存储模块,从而使得基于CUDA的算法时间复杂度很难量化。针对这一问题,提出了一种分层存储理论模型—HMM(Hierarchical Memory Machine)模型,该模型所具有的分层存储结构可以有效地描述图形处理单元设备不同存储模块的物理特性,因此非常适用于对CUDA算法时间复杂度的量化评估。作为HMM模型的应用实例,文章提出了一种基于HMM模型的并行近似字符串匹配算法,并给出了相应算法时间复杂度的计算过程。与串行算法相比,该算法可以获得60倍以上的加速比。
关键词
近似
字符串
匹配
分层存储理论模型
并行算法
CUDA
Keywords
approximate string matching
Hierarchical Memory Machine
parallel computing
CUDA
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
TP333 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种带有长度和位置约束的字符串索引方法
7
作者
于长永
高明
柏禄一
赵宇海
机构
东北大学秦皇岛分校计算机与通信工程学院
东北大学计算机科学与工程学院
出处
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第7期959-963,共5页
基金
国家自然科学基金资助项目(61772124
61332014
+4 种基金
61401080
61402087)
河北省自然科学基金资助项目(F2015501049)
河北省教育厅项目(QN2014339)
中央高校基本科研业务费专项资金资助项目(N150402002)
文摘
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接.
关键词
BWT
字符串
索引
倒排链表
字符串近似匹配
序列比对
Keywords
BWT (Burrows-Wheeler-transform)
string index
inverted list
string similarity match
sequence alignment
分类号
TP311.131 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于网络内容的无阻塞近似流分类的并行建模
8
作者
李旭东
徐扬
李竞
刘斌
机构
清华大学计算机科学与技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第6期938-944,共7页
基金
国家自然科学基金项目(60173009
60373007)
国家"八六三"高技术研究发展计划基金项目(8633000199)
文摘
针对大字符集语言的特点,提出一种并行硬件模型实现基于网络内容的近似流分类.由于采用并行设计和流水线设计,该模型在大规则库下仍有较好的性能,并可适用于高速网络.该并行模型有如下特点:①通过采用不同的规则组合器可完成插入、删除、替代和交换错误的近似匹配;②通过配置参数,可灵活控制近似匹配的程度;③可直接应用于大字符集语言下的网络内容流分类;④针对中文环境做了概率建模,分析了并行硬件模型对网络分组的匹配概率,证明该模型在一般情况下具有较好的可应用性.
关键词
基于内容的流分类
近似
字符串
匹配
并行建模
Keywords
content-based packet classification
approximate string matching
parallel modeling
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
空间数据上Top-k关键词模糊查询算法
被引量:
15
9
作者
胡骏
范举
李国良
陈姗姗
机构
清华大学计算机科学与技术系数据库研究组
出处
《计算机学报》
EI
CSCD
北大核心
2012年第11期2237-2246,共10页
文摘
基于位置的服务(LBS)变得日益普及,越来越多的研究开始关注如何对空间中的兴趣点(POI)做有效的检索.现有的方法提出了空间数据上的关键词检索,研究如何根据查询的位置和关键词找到相关的POI点.然而,现有方法主要对查询关键词进行精确匹配,不能支持模糊查询:当查询关键词与底层数据存在微小差异的时候,LBS系统不能返回相关的结果.为了满足移动用户的模糊查询需求,文中对空间数据上的Top-k关键词模糊查询问题进行研究:给定一组POI点,检索与查询关键词近似匹配且空间上距离相近的Top-k个结果.为了提供高效的模糊查询,文中首先定义了一种新型的相关性函数,综合考虑了文本相似性和空间距离,进而提出了一种有效的索引结构RegionTrie,并基于RegionTrie设计了高效的Top-k算法.真实数据集上的实验结果表明,文中提出的Top-k算法十分高效,性能远好于对比方法.
关键词
基于位置的服务
空间数据上的关键词检索
字符串近似匹配
Keywords
location-based services
spatial keyword search
string similarity search
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
支持块编辑距离的索引结构
被引量:
3
10
作者
王斌
郭庆
李中博
杨晓春
机构
东北大学信息科学与工程学院
中国人民大学数据工程与知识工程教育部重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第1期191-199,共9页
基金
国家自然科学基金项目(60828004
60973018)
+1 种基金
教育部新世纪优秀人才支持计划基金项目(NCET-06-0290)
中国人民大学数据与知识工程教育部重点实验室开放课题(2008002)
文摘
在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性.如何有效地支持块编辑距离,进行近似字符串查询处理具有重要的意义.计算两个字符串的块编辑距离是一个NP完全问题,因此希望提供有效的方法可以增强过滤能力,并减少假通过率.设计了一种支持移动编辑距离的新颖的索引结构SHV-Trie,通过研究移动编辑距离的操作特性,使用字母出现的频率作为支持移动编辑距离操作的一个下界,并且提出相应的查询过滤算法,同时,针对索引SHV-Trie的空间开销过大的问题,提出一种优化字母排列的索引结构和一种压缩的索引结构及相关查询过滤算法.真实数据集上的实验结果与分析显示了所提出的索引结构具有良好的过滤能力,并通过减少效率假通过率提高查询的效率.
关键词
近似
字符串
匹配
块编辑距离
压缩
索引
NP完全问题
Keywords
approximate string matching block edit distance compression index NP-complete problem
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种可扩展的格式化文件内容检查方法
11
作者
高宁
庞立会
机构
中国人民解放军
国防科学技术大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2012年第6期32-37,共6页
文摘
许多业务应用系统将数据以约定格式存放在文件中,通过文件传输实现远距离业务数据传送和处理。通过分析该类业务应用系统存在的安全威胁,本文首次提出了一种可扩展的格式化文件内容检查方法,设计并实现了格式化文件内容检查的原型系统FFC-CIS。FFC-CIS使用正则表达式构造内容格式模板,在业务系统的数据处理之前实现文件内容的安全检查,很好地消除了数据文件被恶意篡改、非法文件传递等安全威胁。为了使内容格式模板的构建快速而便捷,本文还给出了一个基于字符串近似匹配技术的内容格式模板自动生成方法。
关键词
正则表达式
字符串近似匹配
格式化文件
模式自动生成
可扩展
Keywords
regex expression
approximate string matching
files with formatted contents
automaticgenerating templates
scalable
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于内容的音频检索算法
被引量:
2
12
作者
尚永强
张琳梅
徐大伟
机构
信阳农业高等专科学校计算机科学系
出处
《河南科技学院学报》
2009年第3期69-72,共4页
文摘
介绍了基于内容的音频检索系统的基本结构,并在研究国内外相关文献的基础上,分析了音频检索算法的主要特点,划分为以下几种类型:近似字符串匹配算法、基于树结构的音频检索算法、基于动态时间规整的音频检索算法、基于隐马尔克夫模型的音频检索算法以及其它音频检索算法.
关键词
音频检索
近似
字符串
匹配
动态时间规整
隐马尔可夫模型
Keywords
content -based audio retrieval
approximate string matching
dynamic time warping
hidden markov model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种字符串近似匹配的安全查询协议
袁先平
仲红
黄宏升
易磊
《计算机工程》
CAS
CSCD
北大核心
2011
2
下载PDF
职称材料
2
基于字符串近似匹配的模式生成算法
孙进
龚沛曾
《福建电脑》
2010
0
下载PDF
职称材料
3
基于过滤的中文多模式近似字符串匹配算法
范立新
谢晓能
吴飞
《计算机工程》
EI
CAS
CSCD
北大核心
2006
5
下载PDF
职称材料
4
改进的中文近似字符串匹配算法
范立新
《计算机工程与应用》
CSCD
北大核心
2006
8
下载PDF
职称材料
5
基于BPM-BM过滤优化的近似字符串匹配算法
石永革
张毫
《青岛科技大学学报(自然科学版)》
CAS
2016
1
下载PDF
职称材料
6
基于分层存储理论模型的近似字符串匹配并行算法研究
满都呼
宋展
《集成技术》
2016
0
下载PDF
职称材料
7
一种带有长度和位置约束的字符串索引方法
于长永
高明
柏禄一
赵宇海
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
0
下载PDF
职称材料
8
基于网络内容的无阻塞近似流分类的并行建模
李旭东
徐扬
李竞
刘斌
《计算机研究与发展》
EI
CSCD
北大核心
2005
0
下载PDF
职称材料
9
空间数据上Top-k关键词模糊查询算法
胡骏
范举
李国良
陈姗姗
《计算机学报》
EI
CSCD
北大核心
2012
15
下载PDF
职称材料
10
支持块编辑距离的索引结构
王斌
郭庆
李中博
杨晓春
《计算机研究与发展》
EI
CSCD
北大核心
2010
3
下载PDF
职称材料
11
一种可扩展的格式化文件内容检查方法
高宁
庞立会
《计算机工程与科学》
CSCD
北大核心
2012
0
下载PDF
职称材料
12
基于内容的音频检索算法
尚永强
张琳梅
徐大伟
《河南科技学院学报》
2009
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部