题名 一种快速的字符串匹配算法
被引量:24
1
作者
钱屹
侯义斌
机构
西安交通大学电子与信息工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2004年第3期410-413,共4页
文摘
字符串匹配技术在许多领域里广泛应用 ,本文在分析了 BF、BM算法以及一些重要的改进算法的基础上 ,提出了一种新的改进算法—— BMH2 C,该算法利用两个字符计算右移量并保存在二维数组里 ,使右移量增大 ,比较次数减少 ,有效地提高了匹配速度 .
关键词
模式匹配
字符串 检索
字符串 匹配算法
BMH2C算法
BF算法
BM算法
Keywords
pattern matching
string searching
algorithm
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 入侵检测中一种新的快速字符串匹配算法
被引量:10
2
作者
宋华
戴一奇
机构
清华大学计算机系
出处
《计算机工程与应用》
CSCD
北大核心
2003年第32期48-51,89,共5页
基金
国家973基础研究发展规划项目(编号:G1998030409)
文摘
基于字符串匹配的检测方法是入侵检测系统中一类很重要的分析方法。文章首先分析了现有的几种准确字符串匹配算法,然后提出了一种新的多模式字符串匹配算法,并且分析了这些算法的复杂性。最后,文章用具体的实验数据来验证这些算法的性能。通过实验可以看出,新算法使得检测速度大大提高,签名容量大大增加。
关键词
入侵检测
签名匹配算法
多模式字符串 匹配算法
Keywords
Intrusion detection,Signature matching algorithms ,Multi patterns string matching algorithms
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于FPGA的字符串匹配算法
被引量:3
3
作者
杜旭
邱庆哲
黄建
机构
华中科技大学电子与信息工程系
出处
《微电子学与计算机》
CSCD
北大核心
2007年第3期91-94,共4页
基金
华中科技大学国际合作项目
文摘
在全字节比较法的基础上提出了一种基于FPGA的子字符串LUT重用算法。该算法通过位宽扩展,以及流水线间字符串、LUT共享,用低端FPGA成功解决了高速字符串匹配问题,与传统字符串匹配算法相比,该算法大幅缩小了匹配算法芯片资源的占用率,是一种高效的并行多模式字符串匹配算法。
关键词
入侵检测系统
流水线
查找表
子字符串 LUT重用算法
Keywords
intrusion detection systems (IDS)
pipeline
look-up table
sub-string & LUT reuse (SSLR) algorithm
分类号
TP393.05
[自动化与计算机技术—计算机应用技术]
题名 KR字符串匹配算法的研究与实现
被引量:3
4
作者
于海英
机构
内蒙古财经学院计算机信息管理学院
出处
《现代计算机》
2011年第4期12-14,共3页
基金
内蒙古自治区高等学校科学研究项目基金(No.NJ09125)
文摘
字符串匹配是判断模式串(短串)是否是文本串(长串)的子串。KR算法是一种随机串匹配算法,详细介绍KR串匹配算法的算法描述及代码实现过程,并对该算法进行测试,讨论该算法的实现效率。
关键词
KR字符串 匹配算法
文本串
模式串
散列值
Keywords
KR String Matching Algorithm
Text String
Pattern String
Hash Value
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 强自相似分形的字符串替换算法及其应用
5
作者
梅家斌
蔡光兴
机构
武汉科技学院
湖北工学院基础科学部
出处
《湖北工学院学报》
2001年第2期69-71,共3页
文摘
给出了具有强自相似分形图的一种简单的字符串替换算法 。
关键词
分形几何
强自相似分形
字符串 替换算法
图案设计
IFS方法
Keywords
fractal geometry
strong self similiar fraetal
string substitute algorithm
pattern design
IFS method
分类号
O18
[理学—基础数学]
O415.5
[理学—理论物理]
题名 Intel字符串处理指令研究及其应用
6
作者
彭茜珍
机构
湖北科技学院学报编辑部
出处
《湖北科技学院学报》
2018年第6期144-148,共5页
文摘
为了解决软件中字符串处理的低效,降低CPU资源的占用率,提升软件的整体性能,提出了一种基于Intel字符串处理指令的文本处理思路,给出优化字符串传统处理的办法,研究了Intel字符串处理指令的新特性并给出了这些指令的应用。
关键词
字符串 处理算法
处理器
字符串 指令
分类号
TP313
[自动化与计算机技术—计算机软件与理论]
题名 基于字符块跳转技术的藏文字符串匹配算法
7
作者
周磊超
彭展
机构
西藏民族大学信息工程学院
出处
《智能计算机与应用》
2024年第12期90-95,共6页
基金
西藏自治区自然科学基金(XZ202101ZR0089G)。
文摘
字符串匹配算法要求在文本串中查找模式串的出现位置。现有的字符串匹配算法大多针对ASCII字符集,由于藏文结构的特点,若将已有的字符串匹配算法直接应用于藏文上,则会导致其效率出现一定程度的下降。本文分析目前几种较快的字符串匹配算法和藏文结构特点后,提出了一种基于字符块跳转技术的藏文字符串匹配算法-BMH2T算法。BMH2T算法的核心思想是“先跳转,后匹配”,该算法根据文本串中双字符块在模式串的出现位置进行跳转,提高了算法效率。实验结果表明,在处理藏文时,该算法相较于对比算法快约20%~50%,具有更好的性能。
关键词
藏文处理
双字符 块
字符串 匹配算法
Keywords
Tibetan language processing
double character block
string matching algorithm
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 一种用于内容过滤和检测的快速多关键词识别算法
被引量:22
8
作者
宋华
戴一奇
机构
清华大学计算机科学与技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第6期940-945,共6页
基金
国家"九七三"重点基础研究发展规划基金项目 (G19980 3 0 40 9)
文摘
基于字符串匹配的检测方法是内容过滤和检测系统中一类很重要的分析方法 首先分析了现有的几种快速字符串匹配算法 ,然后提出了一种新的多模式字符串匹配算法 ,并简单分析了算法的复杂性 算法在设计的过程中吸取了BM算法中跳跃的特性 ,采用了后缀树算法得到了最大跳跃值 ,采用AC算法的匹配自动机原理从而避免对搜索树内每一个字符的匹配 最后 ,通过具体的实验数据验证了这些算法的性能 通过实验可以看出 ,新算法使得检测速度有很大提高 。
关键词
内容过滤和检测
字符串 匹配算法
多模式字符串 匹配算法
Keywords
content filtering and detection
string matching algorithms
multi pattern string matching algorithm
分类号
TP309
[自动化与计算机技术—计算机系统结构]
TP393.08
[自动化与计算机技术—计算机应用技术]
题名 代码抄袭检测中串匹配算法的比较
被引量:1
9
作者
朱波
郑虹
孙琳琳
机构
长春工业大学计算机科学与工程学院
出处
《长春工业大学学报》
CAS
2014年第6期672-676,共5页
基金
吉林省科技厅自然科学基金资助项目(20130101060JC)
吉林省教育厅"十二五"科学技术研究项目(2014132
2014125)
文摘
对程序代码抄袭检测中多种字符串匹配算法的实现原理进行了描述,给出匹配算法计算相似度的公式以及相对应的时间复杂度。由于字符串匹配算法在程序代码抄袭检测中应用较为广泛,对其中的B-F(Brute-Force)朴素算法、LCS(Longest Common Subsequence)最长公共字串算法、GST(Greedy String Tiling)贪心字符串匹配算法等经典算法的总结比较是一件有意义的研究工作。
关键词
字符串 匹配算法
抄袭检测
最长公共字串
GST
Keywords
string matching algorithm
copy detection
the longest common string
GST (GreedyString Tiling).
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 基于改进遗传算法的岩体结构面产状聚类分析
被引量:8
10
作者
崔学杰
晏鄂川
陈武
机构
中国地质大学(武汉)工程学院
出处
《岩土力学》
EI
CAS
CSCD
北大核心
2019年第A01期374-380,共7页
基金
国家自然科学基金项目(No.41172282,No.41672313)~~
文摘
根据产状对结构面进行分组是研究岩体结构的重要环节。传统分组方法通常需要依靠地质经验,缺乏客观性,而现有的聚类方法也存在一些缺陷。基于变长度字符串遗传算法,提出了一种改进的K均值算法,实现了岩体结构面产状的自动聚类。该方法的核心思想是使用遗传算法为K均值算法选择恰当的聚类中心,克服了K均值(K-means)算法受初始聚类中心影响,易收敛于局部最优解的缺陷。由于使用了变长度字符串,该方法能够在聚类过程中自动确定最佳结构面组数,同时提供最优的分组结果。针对产状数据,提出了一种新的变异方法,该方法利用C++语言实现,并被应用于浙江省某地下水封洞库结构面产状数据的分析,得到较为合理的分组结果,证明了该方法的有效性。
关键词
岩体结构面
产状数据
K均值算法
变长度字符串 遗传算法
Keywords
rock mass discontinuity
occurrence data
K-means algorithm
variable length string genetic algorithm
分类号
TU45
[建筑科学—岩土工程]
题名 一种改进的基因序列匹配算法
被引量:2
11
作者
徐龙
刘晓洁
岳未然
机构
四川大学计算机学院
出处
《网络新媒体技术》
2017年第3期58-64,共7页
基金
国家重点研发计划(2016yfb0800604
2016yfb0800605)
国家自然科学基金项目(61572334)
文摘
提出了一种基于BM算法的改进字符串精确匹配算法。该算法采用双向匹配,充分考虑文本串中当前失匹字符、模式串尾字符与文本串对应的字符、模式串尾字符与文本串对应字符的下一个字符三者之间的关系,同时,在失匹时先不进行跳跃,而是根据当前失匹字符或模式串尾字符对应文本字符的下一个字符预先判断下一次跳跃后文本窗口的尾字符与模式串尾字符是否相同,然后再决定模式串的跳跃距离。从实验结果可知,当改进的算法用于DNA比对时,改进的算法比BM算法、BMHS算法性能更优。
关键词
字符串 匹配算法
DNA检测
BM算法
BMHS算法
改进的BM算法
Keywords
String matching
DNA detection
BM algorithm
BMHS algorithm
Improved BM algorithm
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 基于特征词匹配的政策文本分类算法研究与实现
12
作者
王丽鹏
张鹏云
和志强
机构
河北经贸大学信息技术学院
出处
《河北省科学院学报》
CAS
2017年第3期1-6,共6页
基金
基金项目:河北省科技创新政策法规需求库建设研究(17960119D)
文摘
在基于特征词遍历匹配的文本分类算法中,字符串匹配算法的选取及相似度阈值控制对文本分类结果起着决定性的作用。针对三种常用的字符串匹配算法做了分析及对比实验,选取了最适合政策文本分类的一种字符串匹配算法。并通过研究政策文本具有的特征提出了一种基于特征词加权的相似度阈值计算方法,经实验证明相似度阈值符合分类要求。
关键词
字符串 匹配算法
阈值计算
文本分类
Keywords
String matching algorithm
Threshold calculation
Text categorization
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种优化的字符串seed的求解算法
13
作者
赵基
郭庆
陈纯
张晖
机构
浙江大学计算机科学与技术学院
伦敦大学国王学院 计算机科学系
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2005年第4期399-404,共6页
基金
国家教委高等学校博士学科点专项科研基金(No.20020335020)
浙江省自然科学基金(No.M603230)
文摘
研究了一种重要的字符规律性——字符串的seed。我们利用等价类的概念,提出了等价类树的结构,并在构建前缀等价类树和后缀等价类树的过程中,实时地求解出任意长度的字符串的seed。给定长度为n的字符串,这一算法的时间复杂度为O(nlogn)。
关键词
字符串算法
规律性
覆盖
SEED
等价类
Keywords
String Algorithm, Regularity, Cover, Seed, Equivalence Class
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 维汉机器翻译未登录词识别研究
被引量:9
14
作者
米成刚
王磊
杨雅婷
陈科海
机构
中国科学院新疆理化技术研究所
中国科学院大学
出处
《计算机应用研究》
CSCD
北大核心
2013年第4期1112-1115,共4页
基金
中国科学院战略性先导科技专项资助项目(XDA06030400)
中国科学院"西部之光"人才培养计划"西部博士"资助项目(XBBS201216)
文摘
针对维汉统计机器翻译中未登录词较多的现象和维吾尔语语言资源匮乏这一现状,结合维吾尔语构词特征以及相应的字符串相似度算法,提出了一种基于字符串相似度的维汉机器翻译未登录词识别模型。该模型借助短语表和外部词典,与未翻译的维语词求相似度,取相似度最大短语对应的汉语翻译作为此未登录词的最终翻译。实验证明,与基于词干切分的未登录词识别方法相比,此模型较好地保留了维吾尔语词信息,提高了译文的质量。
关键词
维汉机器翻译
短语表
字符串 相似度算法
未登录词
词切分
编辑距离
Keywords
Uyghur-Chinese machine translation
phrase table
string similarity algorithms
out-of-vocabulary words
word segmentation
edit distance
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 泛化语言模型在汉维机器翻译中的应用
被引量:4
15
作者
李响
南江
杨雅婷
周喜
米成刚
机构
中国科学院新疆理化技术研究所
中国科学院大学
公安局网安支队
出处
《计算机应用研究》
CSCD
北大核心
2014年第10期2994-2997,共4页
基金
中国科学院战略性先导科技专项基金资助项目(XDA06030400)
中国科学院“西部之光”人才培养计划“西部博士”基金资助项目(XBBS201216)
中国科学院西部行动计划资助项目(KGZD-EW-501)
文摘
针对汉维统计机器翻译中维吾尔语具有长距离依赖问题和语言模型具有数据稀疏现象,提出了一种基于泛化的维吾尔语语言模型。该模型借助维吾尔语语言模型的训练过程中生成的文本,结合字符串相似度算法,取相似的维文字符串经过归一化处理抽取规则,计算规则的参数值,利用规则给测试集在解码过程中生成nbest译文重新评分,将评分最高的译文作为最佳译文。实验结果表明,泛化语言模型减少了存储空间,同时,规则的合理使用有效地提高了翻译译文的质量。
关键词
汉维机器翻译
泛化语言模型
字符串 相似度算法
归一化处理
规则
译文评分
Keywords
Chinese-Uyghur machine translation
generalization language model
string similarity algorithms
normalization processing
the rules
score the translation
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 某型雷达信号处理故障诊断系统设计与应用
被引量:1
16
作者
岳锐
吴上上
初建海
徐旭
机构
中国白城兵器试验中心
出处
《计算机测量与控制》
北大核心
2014年第12期3993-3994,4008,共3页
文摘
为快速、准确定位某型雷达信号处理系统故障部位,需要设计一套故障诊断系统;在深入研究信号处理系统工作原理的基础上,通过分类总结信号处理系统故障类型,依托信号处理系统硬件开发平台,采用精确单模式串匹配算法和VC++可视化编程环境,设计开发了信号处理故障诊断系统;在后续试验和设备日常维护中,该诊断系统定位数十次信号处理系统故障;结果表明,该诊断系统具有故障定位快速准确等优点,能够实现信号处理系统故障的快速维修。
关键词
故障诊断
字符串 匹配算法
后缀搜索机制算法
Keywords
fault diagnosis
string matching algorithm
suffix search mechanism algorithm
分类号
TN957.51
[电子电信—信号与信息处理]
题名 程序代码转换技术的研究与实现
被引量:1
17
作者
裴冬梅
聂建忠
赵凤荣
机构
内蒙古师范大学计算机与信息工程学院
出处
《内蒙古煤炭经济》
2010年第6期118-119,共2页
文摘
程序代码转换技术是程序代码抄袭检测技术中的一个重要部分。程序代码转换技术就是把一个程序看作一个文本串,然后再通过一定的文法分析将这个文本串转换成描述程序基本信息的标记串的过程。目前已有多个较有效的抄袭检测系统,如:Jplag,MOSS,YAP等等,但是这些系统中对如何把程序代码进行转换成串的,并没有详细的介绍。本文针对这种情况设计了一个实验系统来实现程序代码转换技术,并进行了验证。
关键词
程序代码转换技术
程序代码抄袭检测技术
词表
字符串 匹配算法
Keywords
Program code token technique
Program detecting technique
vocable table
Character String arithmetic
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
题名 基于Android平台拼写检查工具关键技术研究
被引量:1
18
作者
李顺
机构
沈阳广播电视大学
出处
《电大理工》
2013年第3期79-80,共2页
文摘
研究了基于Android平台的英文拼写检查工具的关键技术,拼写检查工具就是针对英文文档,可以帮助用户来检查编写的英文文档是否正确,并能够根据字符串相似性算法智能的针对错误给出相应的拼写建议,用户可根据给出的拼写建议来修改文档。Android平台的搭建过程以及在Android平台上编写程序应用的关键技术,及编写过程中出现的问题。
关键词
ANDROID平台
拼写检查
字符串 相似性算法
拼写建议
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
题名 分形与分形的计算机模拟
被引量:1
19
作者
冯桂莲
机构
青海民族学院电子工程与信息科学系
出处
《青海师专学报》
2005年第4期90-94,共5页
文摘
分形是一门新的学科,它以自然界中普遍存在的非平衡非线性复杂系统中自发形成的各种时空有序状态(或结构)为研究对象,广泛应用于自然科学的各个领域,甚至于社会科学,并且正起着把现代科学各个领域连接起来的作用.本文从分形的定义着手,通过对von koch曲线的结构特点的分析,设置了分形的字符串替换算法,并且编制了von koch曲线的源程序,最后总结出字符串替换算法的特点.
关键词
分形
字符串 替换算法
维数
Keywords
Fractal
The character bunch replaces algorithms
Dimension
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于iPhone平台拼写检查工具的关键技术研究
20
作者
李顺
杨煦
机构
沈阳广播电视大学信息工程学院
沈阳航空航天大学工程训练中心
出处
《电脑知识与技术》
2013年第8X期5555-5556,共2页
文摘
该文研究内容是基于iPhone平台的英文拼写检查工具的关键技术,拼写检查工具就是针对英文文档,可以帮助用户来检查编写的英文文档是否正确,并能够根据字符串相似性算法智能的针对错误给出相应的拼写建议,用户可根据给出的拼写建议来修改文档。iPhone平台的搭建过程以及在iPhone平台上编写程序应用的关键技术,及编写过程中出现的问题。
关键词
iPhone平台
拼写检查
词库
字符串 相似性算法
Keywords
iPhone platform
spell check
thesaurus
string similarity algorithm
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]