期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于压缩后缀数组技术的搜索引擎 被引量:2
1
作者 姚全珠 张楠 +1 位作者 杨增辉 田元 《计算机工程》 CAS CSCD 北大核心 2008年第10期83-85,88,共4页
目前,搜索引擎的核心模块(索引器)均采用倒排文件结构,对短语查询的准确率较低。该文引入后缀数组技术进行全文索引,为克服全文索引时占用空间大的缺点,研究了压缩后缀数组技术,把后缀数组索引的大小压缩到了O(n)位,并给出应用压缩后缀... 目前,搜索引擎的核心模块(索引器)均采用倒排文件结构,对短语查询的准确率较低。该文引入后缀数组技术进行全文索引,为克服全文索引时占用空间大的缺点,研究了压缩后缀数组技术,把后缀数组索引的大小压缩到了O(n)位,并给出应用压缩后缀数组索引的步骤和核心操作伪代码。对比实验表明,基于压缩后缀数组的索引比传统倒排文件索引的短语查准率提高了近20%。 展开更多
关键词 压缩后缀数组 倒排文件 后缀数组 搜索引擎
下载PDF
基于压缩后缀数组的近似字符串匹配算法 被引量:3
2
作者 胥永康 杨光露 路松峰 《计算机工程与应用》 CSCD 北大核心 2015年第23期139-142,共4页
近似字符串匹配是模式匹配研究领域中的一个重要研究方向。压缩后缀数组是字符串匹配、数据压缩等领域广泛使用的索引结构,具有检索速度快和适用广泛的优点。利用压缩后缀数组,提出了适合近似字符串匹配搜索算法的数据结构,并在此基础... 近似字符串匹配是模式匹配研究领域中的一个重要研究方向。压缩后缀数组是字符串匹配、数据压缩等领域广泛使用的索引结构,具有检索速度快和适用广泛的优点。利用压缩后缀数组,提出了适合近似字符串匹配搜索算法的数据结构,并在此基础上提出了一种匹配搜索算法。实验结果表明,相对于现有的算法,提出的算法在小字母表的情况下具有计算优势。 展开更多
关键词 模式匹配 近似串匹配 后缀数组 压缩后缀数组
下载PDF
基于压缩后缀数组的搜索引擎技术
3
作者 张志锋 刘育熙 +1 位作者 邓璐娟 梁树军 《电脑开发与应用》 2007年第3期30-31,34,共3页
搜索引擎(Search Eng ine)技术是在网络数据成指数级增加的情况下出现的新技术。然而现在的搜索引擎在检索时都采用的是倒排文件,从后缀数据技术出发探讨了压缩后缀数组(Com pressed Su ffix A rray)技术在搜索引擎技术中的应用,从而大... 搜索引擎(Search Eng ine)技术是在网络数据成指数级增加的情况下出现的新技术。然而现在的搜索引擎在检索时都采用的是倒排文件,从后缀数据技术出发探讨了压缩后缀数组(Com pressed Su ffix A rray)技术在搜索引擎技术中的应用,从而大大提高了搜索引擎的性能。 展开更多
关键词 压缩后缀数组 倒排文件 后缀数组 搜索引擎
下载PDF
一个基于压缩后缀数组的乐纹索引算法
4
作者 刘学政 史有群 +1 位作者 罗辛 陶然 《计算机科学》 CSCD 北大核心 2015年第S1期462-464 488,488,共4页
在基于乐纹的音乐检索系统中,提取的乐纹的多少决定了检索结果的匹配度,这就造成了数据库大小与检索匹配度不能兼顾的矛盾。提出使用压缩后缀数组来压缩乐纹索引的方法,解决全文索引时索引空间过大的问题。主要利用有序乐纹数据中较高... 在基于乐纹的音乐检索系统中,提取的乐纹的多少决定了检索结果的匹配度,这就造成了数据库大小与检索匹配度不能兼顾的矛盾。提出使用压缩后缀数组来压缩乐纹索引的方法,解决全文索引时索引空间过大的问题。主要利用有序乐纹数据中较高位特征出现重复的概率大的特点,使用游程编码对乐纹序列进行无损压缩。实验结果表明,该方法在包含2000首歌曲的数据库中仅需要使用原来80%的乐纹数据空间,在包含12000首歌曲的数据库中只需要使用原来30%的乐纹数据空间。与传统的后缀数组索引方法相比,该方法需要的索引存储空间仅为原来的60%。 展开更多
关键词 乐纹 压缩后缀数组 索引压缩 游程编码 垂直编码
下载PDF
基于多面体模型的编译“黑魔法” 被引量:11
5
作者 赵捷 李颖颖 赵荣彩 《软件学报》 EI CSCD 北大核心 2018年第8期2371-2396,共26页
基于多面体模型的编译技术发展近30年,已经在多个开源编译器和商业编译器中得到了应用和实现.与传统的编译优化模型相比,多面体模型具备应用范围广、表示能力强、优化空间大等优点,代表了程序自动并行化领域众多方向最先进的水平,成为... 基于多面体模型的编译技术发展近30年,已经在多个开源编译器和商业编译器中得到了应用和实现.与传统的编译优化模型相比,多面体模型具备应用范围广、表示能力强、优化空间大等优点,代表了程序自动并行化领域众多方向最先进的水平,成为国际上多个编译研发团队的研究热点;同时,多面体模型抽象程度高、实现难度大、面临问题多的特征,阻碍了基于该模型的编译技术在发展相对滞后地区的普及,形成国内专门从事该问题研究的团队屈指可数的现象.为了打开多面体模型的"黑盒子",首先描述了多面体模型的原理,揭示了基于多面体模型的编译流程,并指出了该领域的主要研究内容;接下来,从程序并行性、数据局部性和其他领域上的扩展应用这3个方面对该领域上的研究进展进行了介绍;最后,对该研究领域当前面临的挑战和潜在的研究方向进行了总结.研究目的是通过回顾和总结基于多面体模型的编译技术研究进展,为国内编译研发团队提供重要参考,以期推动我国在该领域上的发展. 展开更多
关键词 多面体模型 并行性 局部性 依赖 调度 代码生成 循环分块 数组压缩
下载PDF
Optimal choice of parameters for particle swarm optimization 被引量:14
6
作者 张丽平 俞欢军 胡上序 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第6期528-534,共7页
The constriction factor method (CFM) is a new variation of the basic particle swarm optimization (PSO), which has relatively better convergent nature. The effects of the major parameters on CFM were systematically inv... The constriction factor method (CFM) is a new variation of the basic particle swarm optimization (PSO), which has relatively better convergent nature. The effects of the major parameters on CFM were systematically investigated based on some benchmark functions. The constriction factor, velocity constraint, and population size all have significant impact on the per- formance of CFM for PSO. The constriction factor and velocity constraint have optimal values in practical application, and im- proper choice of these factors will lead to bad results. Increasing population size can improve the solution quality, although the computing time will be longer. The characteristics of CFM parameters are described and guidelines for determining parameter values are given in this paper. 展开更多
关键词 Particle swarm optimization (PSO) Constriction factor method (CFM) Parameter selection
下载PDF
MOLAP的数据存储设计与实现
7
作者 康志钢 黄厚宽 《铁路计算机应用》 2004年第3期8-11,共4页
引入MOLAP的存储机制,自定义子立方体和块的概念,提出并实现了MOLAP中子立方体存储时块的两种存储方法,即直接多维数组存储和压缩多维数组存储。
关键词 MOLAP 数据存储设计 子立方体存储时块 直接多维数组存储 压缩多维数组存储 多维数据库
下载PDF
浅议Turbo Pascal与标准Pascal的差异
8
作者 王微 《洛阳师范学院学报》 2001年第5期67-68,共2页
本文讨论了TurboPascal与标准Pascal的主要区别 。
关键词 PASCAL 不兼容 字符串 压缩数组 文件类型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部