-
题名基于邻接字符对的三元后缀树全文索引模型
被引量:1
- 1
-
-
作者
姚全珠
赵凯
郭梁涛
-
机构
西安理工大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
2012年第18期42-44,49,共4页
-
文摘
传统后缀树全文索引模型的索引建立复杂、难以维护,且空间消耗大。为此,提出一种改进的后缀树全文索引模型。将一棵完整后缀树划分为若干个三元后缀树,从而简化后缀树的组织结构,便于其建立和维护索引。将邻接字符对的公共前缀作为后缀树的根结点,以降低模型的空间消耗,提高查询效率。实验结果表明,与传统模型相比,该模型具有较高的时空效率。
-
关键词
后缀树
全文索引
邻接字符对
三元后缀树
公共前缀
时空效率
-
Keywords
suffix tree; full-text index; Adjacent Character Pair(ACP); Three Dimensional Suffix Tree(3DST); common prefix; time and space efficiency
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名模式匹配BM算法改进
被引量:15
- 2
-
-
作者
张红梅
范明钰
-
机构
电子科技大学计算机科学与工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第9期3249-3252,共4页
-
基金
国家自然科学基金资助项目(60373109)
北京电子科技学院开放基金资助项目(KFHT200704)
-
文摘
研究BM串匹配算法,分析国内外各种改进算法,结合其优缺点,增加对模式串串末字符或坏字符的邻接字符在模式串中的首次出现位置、存在性、惟一性的判断。根据判断的结果对移动距离重新设置,增加模式串移动距离,减少字符重复比较的次数,以提高匹配效率。
-
关键词
串匹配
末字符
坏字符
邻接字符
惟一性
存在性
-
Keywords
string match
end character
bad character
neighbor character
uniqueness
existence
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-