期刊文献+
共找到152篇文章
< 1 2 8 >
每页显示 20 50 100
Hash-Indexing Block-Based Deduplication Algorithm for Reducing Storage in the Cloud
1
作者 D.Viji S.Revathy 《Computer Systems Science & Engineering》 SCIE EI 2023年第7期27-42,共16页
Cloud storage is essential for managing user data to store and retrieve from the distributed data centre.The storage service is distributed as pay a service for accessing the size to collect the data.Due to the massiv... Cloud storage is essential for managing user data to store and retrieve from the distributed data centre.The storage service is distributed as pay a service for accessing the size to collect the data.Due to the massive amount of data stored in the data centre containing similar information and file structures remaining in multi-copy,duplication leads to increase storage space.The potential deduplication system doesn’t make efficient data reduction because of inaccuracy in finding similar data analysis.It creates a complex nature to increase the storage consumption under cost.To resolve this problem,this paper proposes an efficient storage reduction called Hash-Indexing Block-based Deduplication(HIBD)based on Segmented Bind Linkage(SBL)Methods for reducing storage in a cloud environment.Initially,preprocessing is done using the sparse augmentation technique.Further,the preprocessed files are segmented into blocks to make Hash-Index.The block of the contents is compared with other files through Semantic Content Source Deduplication(SCSD),which identifies the similar content presence between the file.Based on the content presence count,the Distance Vector Weightage Correlation(DVWC)estimates the document similarity weight,and related files are grouped into a cluster.Finally,the segmented bind linkage compares the document to find duplicate content in the cluster using similarity weight based on the coefficient match case.This implementation helps identify the data redundancy efficiently and reduces the service cost in distributed cloud storage. 展开更多
关键词 Cloud computing DEDUPLICATION hash indexing relational content analysis document clustering cloud storage record linkage
下载PDF
基于Hash算法的DNA序列k-mer index问题的数学建模 被引量:3
2
作者 郭方舟 华阳 +1 位作者 董修伟 蔡志丹 《长春理工大学学报(自然科学版)》 2015年第5期116-119,共4页
针对查找DNA序列的相似序列问题,给出了建立索引和查找索引的数学模型,基于Hash算法,建立了依赖于k值大小的顺序索引模型和散列索引模型,特别对较大k值选用了DJBHash函数,有效的避免了Hash冲突问题。最后在硬件平台CPU为2.6GHz、内存为8... 针对查找DNA序列的相似序列问题,给出了建立索引和查找索引的数学模型,基于Hash算法,建立了依赖于k值大小的顺序索引模型和散列索引模型,特别对较大k值选用了DJBHash函数,有效的避免了Hash冲突问题。最后在硬件平台CPU为2.6GHz、内存为8G、操作系统为64位Windows 7的条件下,对100万条长度为100的DNA序列进行了测试,给出了不同k值下建立和查询索引的用时和占用内存情况,有效的解决了DNA序列的k-mer index问题。 展开更多
关键词 hash算法 索引问题 数学模型 复杂度分析
下载PDF
基于共享内存的能量管理系统实时库非主键HASH索引 被引量:14
3
作者 王瑾 彭晖 侯勇 《电力系统自动化》 EI CSCD 北大核心 2011年第13期72-76,共5页
实时库是能量管理系统的核心之一,大部分实时数据的处理基于实时库。引入索引能够极大地优化实时库查找操作,提高实时库性能。文中介绍了HASH索引的查找算法和实现方式,设计了针对"父找子"型关系查找的双溢出型HASH索引,并介... 实时库是能量管理系统的核心之一,大部分实时数据的处理基于实时库。引入索引能够极大地优化实时库查找操作,提高实时库性能。文中介绍了HASH索引的查找算法和实现方式,设计了针对"父找子"型关系查找的双溢出型HASH索引,并介绍了其数据结构和查找算法。分析数据表明,双溢出索引适合于"父找子"型关系的查找,具有很高的查找效率。 展开更多
关键词 实时库 索引 溢出区 双溢出hash型索引
下载PDF
用于内存数据库的Hash索引的设计与实现 被引量:21
4
作者 袁培森 皮德常 《计算机工程》 CAS CSCD 北大核心 2007年第18期69-71,共3页
电信领域已成为数据密集型行业,需要高性能的数据库系统作为支撑系统,基于磁盘的数据库系统不能满足"实时"、"近实时"访问数据库的需求,将数据库核心数据驻留在内存中,可以使用内存数据库来满足需求。Hash索引是数... 电信领域已成为数据密集型行业,需要高性能的数据库系统作为支撑系统,基于磁盘的数据库系统不能满足"实时"、"近实时"访问数据库的需求,将数据库核心数据驻留在内存中,可以使用内存数据库来满足需求。Hash索引是数据库系统中广泛使用的索引技术之一,它能够快速地访问数据,易于设计和实现。该文根据内存数据库的特点,为电信网管系统的内存数据库设计并实现了Hash索引。 展开更多
关键词 内存数据库 hash索引 磁盘数据库系统
下载PDF
用于图像Hash的视觉相似度客观评价测度 被引量:4
5
作者 唐振军 王朔中 +1 位作者 魏为民 苏胜君 《中国图象图形学报》 CSCD 北大核心 2008年第10期2039-2042,共4页
由于评价图像Hash性能时,要求对两幅图像是否在感知上相似做出判断,因此针对这一需求,提出了一种衡量感知相似程度的评价测度。该测度的确定是先对图像进行低通滤波,再进行图像重叠分块;然后运用相关系数检测法计算每一对分块的相似程度... 由于评价图像Hash性能时,要求对两幅图像是否在感知上相似做出判断,因此针对这一需求,提出了一种衡量感知相似程度的评价测度。该测度的确定是先对图像进行低通滤波,再进行图像重叠分块;然后运用相关系数检测法计算每一对分块的相似程度,并对相似系数归一化,再分别计算若干个最小和最大的归一化相似系数的乘积;最后用最小相似系数乘积与最大相似系数乘积的比值作为感知相似性的测度。实验结果表明,该测度不仅可有效反映图像视觉质量的变化,而且能较好地区分两幅图像是否存在重要的视觉差异,其对感知相似进行评价的性能优于峰值信噪比。 展开更多
关键词 感知相似 客观评价 图像hash 图像摘要 图像索引
下载PDF
基于Hash链的RFID安全双向认证协议 被引量:10
6
作者 裴小强 卫宏儒 《计算机应用》 CSCD 北大核心 2014年第A01期47-49,54,共4页
针对应用于射频识别(RFID)系统中的Hash链协议在可扩展性和安全性方面存在的缺陷,提出了一种高效可扩展的改进协议。协议提供了标签与阅读器之间的双向认证,通过利用标签ID的唯一性建立了数据索引,并引入用于标识标签被访问次数的访问... 针对应用于射频识别(RFID)系统中的Hash链协议在可扩展性和安全性方面存在的缺陷,提出了一种高效可扩展的改进协议。协议提供了标签与阅读器之间的双向认证,通过利用标签ID的唯一性建立了数据索引,并引入用于标识标签被访问次数的访问计数器来提高后台数据库的检索效率,降低了系统计算载荷。利用共享密值与访问计数器的自更新特性以及哈希函数的单向性使协议能够抵抗重放攻击和标签伪装等安全威胁。分析结果表明,协议在运算效率及安全性方面都有所提高,具有较好的可扩展性,适用于标签数目较多的RFID系统。 展开更多
关键词 射频识别 哈希链 可扩展性 访问计数器 索引
下载PDF
一种改进的基于Hash算法及概率的k-mer索引方法 被引量:2
7
作者 史晓楠 徐澜 +1 位作者 徐丹丹 高慧慧 《通信电源技术》 2017年第3期70-72,74,共4页
文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式,然后使用该编码方案对k-mer碱基串进行编码,最后得到唯一的Hash值。根据k值的大小,建立相应长度的Hash表... 文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式,然后使用该编码方案对k-mer碱基串进行编码,最后得到唯一的Hash值。根据k值的大小,建立相应长度的Hash表,在每个Hash位置下以链表的形式挂接位置信息,从而建立了索引模型。提出一种将四叉树进行编码压缩的索引方案——"线性Hash编码索引模型",消除了四叉树索引模型中父节点内存浪费问题。同时,查询速度从树形的O(log4n)降到了线性的0(1),得到很大地提高。 展开更多
关键词 k-mer 树形索引 hash索引 哈弗曼编码 概率模型
下载PDF
Hash索引算法综述 被引量:3
8
作者 颜文 陈征 《无线通信技术》 2019年第2期19-24,29,共7页
在这个数据量爆炸增长的时代,如何在海量数据中实现对所需数据快速精准的查找成为必须面对的难题。哈希索引(Hash Index)将数据相关值输入哈希函数中,通过哈希函数计算得到哈希码,从而找到数据对应的存储地址。这种方法大大提高了数据... 在这个数据量爆炸增长的时代,如何在海量数据中实现对所需数据快速精准的查找成为必须面对的难题。哈希索引(Hash Index)将数据相关值输入哈希函数中,通过哈希函数计算得到哈希码,从而找到数据对应的存储地址。这种方法大大提高了数据检索的速度和准确度并优化了存储空间结构,一定程度上解决了海量数据处理较慢的难题,因此被当今学者广为研究。本文将综述哈希索引的定义和特点,介绍哈希索引的传统算法和新兴算法,最后总结全文并展望未来的研究方向。 展开更多
关键词 哈希索引 哈希码 键值 数据检索
下载PDF
一种应用于搜索引擎URL检索的hash算法设计与实现 被引量:1
9
作者 李伟伟 贾志洋 周粉 《现代计算机》 2009年第4期113-115,共3页
针对MD5在搜索引擎URL检索中的应用,指出其不足之处,设计一种应用于搜索引擎URL索引的消息摘要算法,与MD5算法比较,该算法生成了较短的hash值,可以节约内存空间、提高检索效率,并且该算法可以充分利用可用的hash值域空间。
关键词 URL检索 hash函数 消息摘要 搜索引擎
下载PDF
IndexPeer:半结构化P2P系统资源发现模型及其DHT算法 被引量:1
10
作者 刘小虎 蒋从锋 李垦 《计算机应用研究》 CSCD 北大核心 2008年第6期1648-1651,共4页
提出了一种基于半结构化P2P系统的资源发现模型——IndexPeer模型。该模型采用三层索引结构,由下至上分别为virtual organization层、service peer层和indexpeer层。IndexPeer充分利用P2P系统中的节点性能差异,具有高效的查找功能,且对... 提出了一种基于半结构化P2P系统的资源发现模型——IndexPeer模型。该模型采用三层索引结构,由下至上分别为virtual organization层、service peer层和indexpeer层。IndexPeer充分利用P2P系统中的节点性能差异,具有高效的查找功能,且对网络的高度动态性有良好的适应性。针对Index Peer模型的体系结构,对该模型的结构化层DHT算法进行了研究和设计。基于small-world的仿真实验表明,IndexPeer模型的体系结构及其结构化层DHT算法具有较好的鲁棒性和一定的可扩展性。 展开更多
关键词 分布式哈希表 点对点系统 索引 资源发现 搜索
下载PDF
基于Hash索引的高通量基因序列比对并行加速技术研究 被引量:4
11
作者 王文迪 汤文 +3 位作者 段勃 张春明 张佩珩 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2463-2471,共9页
近年来随着高通量基因测序技术的迅速发展,测序成本和周期都得到了大幅降低.然而,新一代测序技术海量数据生成能力以及各类测序算法蕴含的高并发性却对现有计算机的运算能力提出了新挑战.以一个基于Hash索引算法实现的开源重测序程... 近年来随着高通量基因测序技术的迅速发展,测序成本和周期都得到了大幅降低.然而,新一代测序技术海量数据生成能力以及各类测序算法蕴含的高并发性却对现有计算机的运算能力提出了新挑战.以一个基于Hash索引算法实现的开源重测序程序(PerM)为例,研究了在商用多核CPU上加速该应用程序的关键技术.在一个64核SMP系统上的实验结果证明,提出的优化技术可以使Cache缺失率降低90%,性能提升4~11倍.接下来探讨了在一个包含XilinxLX330FPGA的加速卡上设计实现专用并行加速系统的相关问题.作为原型验证系统,在基于FPGA的PCIe加速卡上设计并实现了包含11个处理单元的脉动陈列并行计算系统.和IntelXeonX75508核CPU相比,提出的并行加速器有30~65倍性能功耗比优势. 展开更多
关键词 hash索引 生物信息学 高通量测序 FPGA 并行加速器
下载PDF
Hash表与B^+树相结合的高效目录索引结构 被引量:7
12
作者 刘贤焯 王劲林 +2 位作者 朱明 邓峰 孙鹏 《西安交通大学学报》 EI CAS CSCD 北大核心 2013年第4期105-111,共7页
针对目前文件系统目录结构在处理大量文件,尤其是单个大目录时文件创建、查找和删除速度较慢的问题,提出一种面向Web服务器存储系统的目录索引结构。该结构利用Hash函数对变长关键字的压缩特性和Hash表的O(1)查找复杂度进行文件名的快... 针对目前文件系统目录结构在处理大量文件,尤其是单个大目录时文件创建、查找和删除速度较慢的问题,提出一种面向Web服务器存储系统的目录索引结构。该结构利用Hash函数对变长关键字的压缩特性和Hash表的O(1)查找复杂度进行文件名的快速查找,并使用B+树高效索引目录的子索引节点。测试结果表明,该结构能够快速地处理大量文件,单个大文件夹下的文件查找速度相比Ext3提高了40%,文件创建、删除速度比Ext3和Reiserfs加快了73%。 展开更多
关键词 文件系统 目录索引 哈希表 B+树
下载PDF
基于Buddy^*-Hash的移动对象时空查询方法 被引量:4
13
作者 刘玥 郝忠孝 《计算机工程》 CAS CSCD 北大核心 2010年第4期47-49,共3页
索引技术可以提高数据检索和查询效率,为了实现对时空数据库中移动对象的查询操作,需要引入时空索引技术。在传统Buddy-树的基础上提出Buddy*-Hash索引结构,根据扩展查询窗口策略给出范围查询算法。实验结果表明,基于BH索引结构的范围... 索引技术可以提高数据检索和查询效率,为了实现对时空数据库中移动对象的查询操作,需要引入时空索引技术。在传统Buddy-树的基础上提出Buddy*-Hash索引结构,根据扩展查询窗口策略给出范围查询算法。实验结果表明,基于BH索引结构的范围查询算法具有良好性能。 展开更多
关键词 移动对象 索引结构 hash辅助索引表 范围查询
下载PDF
基于Hash+链表索引的专用型内存数据库系统的设计与实现
14
作者 黄炜 《电脑与信息技术》 2011年第3期52-55,共4页
文章研究了内存数据库管理系统的原理和关键技术,根据移动短信监控系统中内存数据库的特点,设计和实现了一个基于Hash+链表索引的专用型内存数据库系统,用于解决垃圾短信分析系统中海量短信的存取问题。
关键词 垃圾短信系统 内存数据库 hash索引
下载PDF
二级Hash全局和局部索引筛选的长序列比对并行算法 被引量:3
15
作者 潘登 钟诚 《小型微型计算机系统》 CSCD 北大核心 2022年第9期1999-2004,共6页
通过构建参考基因组的二级Hash索引,以快速筛选出测序长序列在参考基因组中可能匹配的候选区域;建立测序序列局部索引,以加速测序序列和参考基因组候选区域之间的映射定位;对每个候选区域里的k-mer与测序序列的索引命中进行左右扩展获... 通过构建参考基因组的二级Hash索引,以快速筛选出测序长序列在参考基因组中可能匹配的候选区域;建立测序序列局部索引,以加速测序序列和参考基因组候选区域之间的映射定位;对每个候选区域里的k-mer与测序序列的索引命中进行左右扩展获得比对种子;采用等距离抽样方式对种子抽取多个位置,利用抽样结果建立判断依据来过滤掉那些不可能匹配的种子;建立处理包含“均聚物”类型错误的序列片段全局比对得分方程,并行填补比对骨架的空隙,并采取GPU显存预分配和后释放独立的并行比对策略,以提升序列片段全局并行比对效率.模拟与真实数据的实验结果表明,相较于已有同类的长序列比对并行算法,本文提出的并行算法获得整体上较高的比对敏感度、碱基层次灵敏度和准确度,且可有效处理第3代测序长序列含有的“均聚物”类型错误,显著加速了大规模长序列与参考基因组比对的完成. 展开更多
关键词 序列比对 并行算法 hash索引 动态规划 筛选
下载PDF
基于Hash表的数据库索引结构设计与实现 被引量:3
16
作者 汪超 何丕廉 李志明 《微处理机》 2007年第4期53-56,共4页
索引结构的优劣对RDBMS的查询速度起着至关重要的作用,目前比较成熟的组织索引的数据结构有Hash表和B-Tree结构。基于Hash表给出了一种RDBMS索引以及存储结构的详细设计方案并加以实现。
关键词 数据库 存储 索引 哈希表
下载PDF
基于Hash结构词典的双向最大匹配分词法 被引量:18
17
作者 陈之彦 李晓杰 +2 位作者 朱淑华 付丹龙 邢诒海 《计算机科学》 CSCD 北大核心 2015年第B11期49-54,共6页
针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分... 针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分词中出现的交集型歧义。该算法可以在分词的过程中显著提高分词的精确度,适用于对词语切分精度要求较高的中文语言处理系统。 展开更多
关键词 分词词典 双向最大匹配法 基于hash的单字索引 互信息歧义处理
下载PDF
Structural Indexing for 3D Solid Digital Library 被引量:1
18
作者 Han Shui\|hua, Lu Zheng\|ding, Chen Chuan\|bo Department of Computer Engineering, Huazhong University of Science and Teclonogy, Wuhan 430074,Chian 《Wuhan University Journal of Natural Sciences》 CAS 2001年第Z1期438-442,共5页
In a very large digital library that support computer aided collaborative design, an indexing process is crucial whenever the retrieval process has to select among many possible designs. In this paper, we address the... In a very large digital library that support computer aided collaborative design, an indexing process is crucial whenever the retrieval process has to select among many possible designs. In this paper, we address the problem of retrieving important design and engineering information by structural indexing. A design is represented by a model dependency graph, therefor, the indexing problem is to determine whether a graph is present or absent in a database of model dependency graphs. we present a novel graph indexing method using polynomial characterization of a model dependency graph and on hashing. Such an approach is able to create an high efficient 3D solid digital library for retrieving and extracting solid geometric model and engineering information. 展开更多
关键词 digital library computer aided design model dependency graphs hashING indexING
下载PDF
基于hash技术的ext3目录索引机制的改进
19
作者 王裕邦 卢显良 +3 位作者 段翰聪 唐晖 吴车海 刘江 《计算机应用研究》 CSCD 北大核心 2007年第10期229-231,234,共4页
针对当前广泛应用的ext3文件系统对超过一定长度的目录进行索引操作时,其性能明显下降的现象,首先对其原因进行了分析,提出一种基于hash技术的ext3目录索引问题的解决方案,并在此基础上给出了实现代码。通过几种测试平台所获得的实验数... 针对当前广泛应用的ext3文件系统对超过一定长度的目录进行索引操作时,其性能明显下降的现象,首先对其原因进行了分析,提出一种基于hash技术的ext3目录索引问题的解决方案,并在此基础上给出了实现代码。通过几种测试平台所获得的实验数据证明了该hash技术对解决ext3性能瓶颈的有效性。 展开更多
关键词 哈希技术 ext3文件系统 目录索引 B树
下载PDF
一种基于变参级联混沌的Hash函数算法 被引量:3
20
作者 吴涛 金建国 魏明军 《计算机研究与发展》 EI CSCD 北大核心 2016年第3期674-681,共8页
针对级联混沌可能存在的密钥泄漏风险以及当前Hash函数的不足,提出了一种基于变参级联混沌的Hash函数算法,即在构成Hash函数的级联驱动系统中,引入了另一混沌系统的状态变量作为参数扰动,并在扰动强度的控制下实现安全的变参级联系统.... 针对级联混沌可能存在的密钥泄漏风险以及当前Hash函数的不足,提出了一种基于变参级联混沌的Hash函数算法,即在构成Hash函数的级联驱动系统中,引入了另一混沌系统的状态变量作为参数扰动,并在扰动强度的控制下实现安全的变参级联系统.由此构成的Hash函数不仅具有符合混沌规律的变参特性,同时还具有级联子系统间逐级串扰的性质,能有效降低由计算机有限精度和数字量化可能造成的短周期行为风险,对提高压缩函数内部结构的复杂度和抗碰撞性有着显著意义.实验结果表明:与其他混沌Hash算法和SHA-3算法相比,该算法具有高度的初值敏感性和良好的混乱与扩散性能,抗碰撞能力强,算法实现简单灵活,变参系统可控性强,在混沌保密通信、数字签名等领域具有良好的推广前景. 展开更多
关键词 级联混沌 hash函数 参数扰动 LYAPUNOV指数 抗碰撞性
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部