期刊文献+
共找到151篇文章
< 1 2 8 >
每页显示 20 50 100
Hash-Indexing Block-Based Deduplication Algorithm for Reducing Storage in the Cloud
1
作者 D.Viji S.Revathy 《Computer Systems Science & Engineering》 SCIE EI 2023年第7期27-42,共16页
Cloud storage is essential for managing user data to store and retrieve from the distributed data centre.The storage service is distributed as pay a service for accessing the size to collect the data.Due to the massiv... Cloud storage is essential for managing user data to store and retrieve from the distributed data centre.The storage service is distributed as pay a service for accessing the size to collect the data.Due to the massive amount of data stored in the data centre containing similar information and file structures remaining in multi-copy,duplication leads to increase storage space.The potential deduplication system doesn’t make efficient data reduction because of inaccuracy in finding similar data analysis.It creates a complex nature to increase the storage consumption under cost.To resolve this problem,this paper proposes an efficient storage reduction called Hash-Indexing Block-based Deduplication(HIBD)based on Segmented Bind Linkage(SBL)Methods for reducing storage in a cloud environment.Initially,preprocessing is done using the sparse augmentation technique.Further,the preprocessed files are segmented into blocks to make Hash-Index.The block of the contents is compared with other files through Semantic Content Source Deduplication(SCSD),which identifies the similar content presence between the file.Based on the content presence count,the Distance Vector Weightage Correlation(DVWC)estimates the document similarity weight,and related files are grouped into a cluster.Finally,the segmented bind linkage compares the document to find duplicate content in the cluster using similarity weight based on the coefficient match case.This implementation helps identify the data redundancy efficiently and reduces the service cost in distributed cloud storage. 展开更多
关键词 Cloud computing DEDUPLICATION hash indexing relational content analysis document clustering cloud storage record linkage
下载PDF
基于Hash算法的DNA序列k-mer index问题的数学建模 被引量:3
2
作者 郭方舟 华阳 +1 位作者 董修伟 蔡志丹 《长春理工大学学报(自然科学版)》 2015年第5期116-119,共4页
针对查找DNA序列的相似序列问题,给出了建立索引和查找索引的数学模型,基于Hash算法,建立了依赖于k值大小的顺序索引模型和散列索引模型,特别对较大k值选用了DJBHash函数,有效的避免了Hash冲突问题。最后在硬件平台CPU为2.6GHz、内存为8... 针对查找DNA序列的相似序列问题,给出了建立索引和查找索引的数学模型,基于Hash算法,建立了依赖于k值大小的顺序索引模型和散列索引模型,特别对较大k值选用了DJBHash函数,有效的避免了Hash冲突问题。最后在硬件平台CPU为2.6GHz、内存为8G、操作系统为64位Windows 7的条件下,对100万条长度为100的DNA序列进行了测试,给出了不同k值下建立和查询索引的用时和占用内存情况,有效的解决了DNA序列的k-mer index问题。 展开更多
关键词 hash算法 索引问题 数学模型 复杂度分析
下载PDF
面向持久化键值数据库的自适应热点感知哈希索引
3
作者 王楠 吴云 《计算机应用研究》 CSCD 北大核心 2024年第1期226-230,253,共6页
针对现有键值数据库存储系统缺乏热点意识,导致系统在高度倾斜的工作负载下性能较差且不可靠,提出了一种自适应热点感知哈希索引模型,该模型基于key值摘要信息实现了一个高性能哈希表。首先,利用key的摘要信息代替key值,压缩key的存储空... 针对现有键值数据库存储系统缺乏热点意识,导致系统在高度倾斜的工作负载下性能较差且不可靠,提出了一种自适应热点感知哈希索引模型,该模型基于key值摘要信息实现了一个高性能哈希表。首先,利用key的摘要信息代替key值,压缩key的存储空间,优化哈希表中桶的数据结构;其次,利用CPU的数据级并行技术以及CPU cache line,对哈希表的探查操作进行优化;最后,为解决摘要信息导致key值无法精准比较,需要额外磁盘I/O的问题,设计了一种自适应key值调度算法,该算法根据当前可用内存大小、哈希索引负载以及访问热点情况动态地调整key值的存储位置。在YCSB仿真数据集上进行了实验,实验表明,相较于最先进的哈希表,自适应热点感知哈希索引在相同内存使用率的情况下,将速度提升至1.2倍。 展开更多
关键词 持久化键值存储 自适应 热点感知 哈希索引
下载PDF
面向主从区块链的多级索引构建方法
4
作者 王俊陆 张桂月 +2 位作者 杜立宽 李素 陈廷伟 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期799-807,共9页
主从区块链是一种面向领域的、采用高效密码学原理进行大数据可信化通信及存储的新型信息处理技术.随着领域数据规模的指数级增长,现有主从区块链系统存在的查询效率低、溯源时间长等问题愈发严重.针对这些问题,提出一种面向主从区块链... 主从区块链是一种面向领域的、采用高效密码学原理进行大数据可信化通信及存储的新型信息处理技术.随着领域数据规模的指数级增长,现有主从区块链系统存在的查询效率低、溯源时间长等问题愈发严重.针对这些问题,提出一种面向主从区块链的多级索引构建方法(multi-level index construction method for master-slave blockchain,MSMLI).首先,MSMLI引入权重矩阵,基于主链结构将整个主从区块链进行分片,并对各个分片进行权重赋值;其次,针对每个分片内的主区块链,提出基于跳跃一致性哈希的主链索引构建方法(master chain index construction method based on jump consistent Hash,JHMI),输入节点关键值和索引槽位数量,输出主链索引;最后,引入布隆过滤器,改进基于列的选择函数,对各个主区块对应的从属区块链构建2级复合索引.在3种约束条件和2类数据集上的实验结果表明,MSMLI对比现有方法,平均能够缩减9.28%的索引构建时间,提升12.07%的查询效率,同时降低24.4%的内存开销. 展开更多
关键词 区块链 索引 分片 跳跃一致性哈希 改进布隆过滤器
下载PDF
基于共享内存的能量管理系统实时库非主键HASH索引 被引量:14
5
作者 王瑾 彭晖 侯勇 《电力系统自动化》 EI CSCD 北大核心 2011年第13期72-76,共5页
实时库是能量管理系统的核心之一,大部分实时数据的处理基于实时库。引入索引能够极大地优化实时库查找操作,提高实时库性能。文中介绍了HASH索引的查找算法和实现方式,设计了针对"父找子"型关系查找的双溢出型HASH索引,并介... 实时库是能量管理系统的核心之一,大部分实时数据的处理基于实时库。引入索引能够极大地优化实时库查找操作,提高实时库性能。文中介绍了HASH索引的查找算法和实现方式,设计了针对"父找子"型关系查找的双溢出型HASH索引,并介绍了其数据结构和查找算法。分析数据表明,双溢出索引适合于"父找子"型关系的查找,具有很高的查找效率。 展开更多
关键词 实时库 索引 溢出区 双溢出hash型索引
下载PDF
用于内存数据库的Hash索引的设计与实现 被引量:21
6
作者 袁培森 皮德常 《计算机工程》 CAS CSCD 北大核心 2007年第18期69-71,共3页
电信领域已成为数据密集型行业,需要高性能的数据库系统作为支撑系统,基于磁盘的数据库系统不能满足"实时"、"近实时"访问数据库的需求,将数据库核心数据驻留在内存中,可以使用内存数据库来满足需求。Hash索引是数... 电信领域已成为数据密集型行业,需要高性能的数据库系统作为支撑系统,基于磁盘的数据库系统不能满足"实时"、"近实时"访问数据库的需求,将数据库核心数据驻留在内存中,可以使用内存数据库来满足需求。Hash索引是数据库系统中广泛使用的索引技术之一,它能够快速地访问数据,易于设计和实现。该文根据内存数据库的特点,为电信网管系统的内存数据库设计并实现了Hash索引。 展开更多
关键词 内存数据库 hash索引 磁盘数据库系统
下载PDF
基于双哈希索引的高效语音生物哈希安全检索算法
7
作者 黄羿博 陈德怀 张秋余 《信息安全学报》 CSCD 2024年第2期69-83,共15页
针对语音数据在信道传输与云端存储时的安全性问题,以及由于语音数据数目大、维数高、空间复杂度高带来的检索效率问题,提出了一种基于双哈希索引的高效语音生物哈希安全检索算法。首先,在服务端分别提取语音信号的频谱通量与峭度因子... 针对语音数据在信道传输与云端存储时的安全性问题,以及由于语音数据数目大、维数高、空间复杂度高带来的检索效率问题,提出了一种基于双哈希索引的高效语音生物哈希安全检索算法。首先,在服务端分别提取语音信号的频谱通量与峭度因子特征并将两种特征融合,利用Bagging分类对语音信号的差分哈希分类,并基于分类结果构建密钥分配索引表;然后,根据密钥分配索引表建立具有单一映射密钥的生物特征模板,并将其量化构造生物哈希,得到哈希索引;同时,采用混合域置乱加密算法对原始语音加密,构建密文语音库;最后,将哈希索引与密文语音库上传至云端并构建云端生物哈希索引表。在移动端,采用归一化汉明距离进行匹配检索。实验结果表明:本文算法的匹配阈值区间为(0.2694, 0.4173),说明该检索算法能够灵活选取匹配阈值,具有较好的鲁棒性和区分性;检索过程中单条语音平均检索时间仅为9.4957×10^(–4)s,并且经过15种内容保持操作后的查全率与查准率均为100%,说明该算法具有较好的检索性能,可以满足各种环境下的语音检索需求;同时提出的加密算法密钥空间大小为1060,说明能够抵御穷举密钥攻击、保证语音数据的安全;此外,构建的生物特征模板具有良好的多样性、安全性和可撤销性。 展开更多
关键词 安全语音检索 双哈希索引 生物特征模板 生物哈希 密文语音
下载PDF
基于同态哈希函数和虚拟索引的动态云审计方案
8
作者 李秀广 袁文勇 +2 位作者 李瑞峰 李晖 杨晓元 《郑州大学学报(理学版)》 CAS 北大核心 2024年第2期9-17,共9页
为更好地实现云存储的数据完整性验证,解决云数据安全更新效率低的问题,提出一种基于同态哈希函数和虚拟索引的动态审计方案。首先对上传云服务器的数据进行盲化,以保护原始数据在云中的隐私;接着利用同态哈希算法对盲化后的数据进行签... 为更好地实现云存储的数据完整性验证,解决云数据安全更新效率低的问题,提出一种基于同态哈希函数和虚拟索引的动态审计方案。首先对上传云服务器的数据进行盲化,以保护原始数据在云中的隐私;接着利用同态哈希算法对盲化后的数据进行签名,以便签名聚合的计算;然后利用虚拟索引实现对特定数据块快速查找和更新的同时,不对其他数据造成影响;最后,将提出的动态云审计方案扩展为批量验证方案,从而提高多用户场景下完整性验证的效率。理论分析表明,该方案是安全高效的。 展开更多
关键词 云审计 完整性验证 同态哈希函数 虚拟索引 批量验证
下载PDF
基于一致性哈希算法的分布式数据库索引查询优化方法
9
作者 刘晓梅 董仲博 《吉首大学学报(自然科学版)》 CAS 2024年第1期36-41,共6页
为了解决分布式数据库索引查询负载不平衡的问题,基于一致性哈希算法设计了分布式数据库索引查询优化方法.根据分布式数据库服务器节点CPU处理能力、带宽和缓存大小,采用动态反馈机制计算各服务器节点的索引查询负载率,通过一致性哈希... 为了解决分布式数据库索引查询负载不平衡的问题,基于一致性哈希算法设计了分布式数据库索引查询优化方法.根据分布式数据库服务器节点CPU处理能力、带宽和缓存大小,采用动态反馈机制计算各服务器节点的索引查询负载率,通过一致性哈希负载平衡算法将任务分配给各服务器节点,并实时调整负载.以最小总代价为目标,利用多蚁群算法求得最佳查询路径.实验结果显示,基于一致性哈希算法的优化方法整体曲线趋势较平稳,在用户请求数量为4 000条时,最大负载平衡度为1.5%,全程响应时间小于35 ms.这说明该方法能够有效调整分布式数据库的负载分布,且受数据库规模影响较小,具备强大的查询响应能力. 展开更多
关键词 一致性哈希 索引查询 分布式数据库 负载平衡 多蚁群算法 学习算子
下载PDF
用于图像Hash的视觉相似度客观评价测度 被引量:4
10
作者 唐振军 王朔中 +1 位作者 魏为民 苏胜君 《中国图象图形学报》 CSCD 北大核心 2008年第10期2039-2042,共4页
由于评价图像Hash性能时,要求对两幅图像是否在感知上相似做出判断,因此针对这一需求,提出了一种衡量感知相似程度的评价测度。该测度的确定是先对图像进行低通滤波,再进行图像重叠分块;然后运用相关系数检测法计算每一对分块的相似程度... 由于评价图像Hash性能时,要求对两幅图像是否在感知上相似做出判断,因此针对这一需求,提出了一种衡量感知相似程度的评价测度。该测度的确定是先对图像进行低通滤波,再进行图像重叠分块;然后运用相关系数检测法计算每一对分块的相似程度,并对相似系数归一化,再分别计算若干个最小和最大的归一化相似系数的乘积;最后用最小相似系数乘积与最大相似系数乘积的比值作为感知相似性的测度。实验结果表明,该测度不仅可有效反映图像视觉质量的变化,而且能较好地区分两幅图像是否存在重要的视觉差异,其对感知相似进行评价的性能优于峰值信噪比。 展开更多
关键词 感知相似 客观评价 图像hash 图像摘要 图像索引
下载PDF
基于Hash链的RFID安全双向认证协议 被引量:10
11
作者 裴小强 卫宏儒 《计算机应用》 CSCD 北大核心 2014年第A01期47-49,54,共4页
针对应用于射频识别(RFID)系统中的Hash链协议在可扩展性和安全性方面存在的缺陷,提出了一种高效可扩展的改进协议。协议提供了标签与阅读器之间的双向认证,通过利用标签ID的唯一性建立了数据索引,并引入用于标识标签被访问次数的访问... 针对应用于射频识别(RFID)系统中的Hash链协议在可扩展性和安全性方面存在的缺陷,提出了一种高效可扩展的改进协议。协议提供了标签与阅读器之间的双向认证,通过利用标签ID的唯一性建立了数据索引,并引入用于标识标签被访问次数的访问计数器来提高后台数据库的检索效率,降低了系统计算载荷。利用共享密值与访问计数器的自更新特性以及哈希函数的单向性使协议能够抵抗重放攻击和标签伪装等安全威胁。分析结果表明,协议在运算效率及安全性方面都有所提高,具有较好的可扩展性,适用于标签数目较多的RFID系统。 展开更多
关键词 射频识别 哈希链 可扩展性 访问计数器 索引
下载PDF
一种改进的基于Hash算法及概率的k-mer索引方法 被引量:2
12
作者 史晓楠 徐澜 +1 位作者 徐丹丹 高慧慧 《通信电源技术》 2017年第3期70-72,74,共4页
文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式,然后使用该编码方案对k-mer碱基串进行编码,最后得到唯一的Hash值。根据k值的大小,建立相应长度的Hash表... 文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式,然后使用该编码方案对k-mer碱基串进行编码,最后得到唯一的Hash值。根据k值的大小,建立相应长度的Hash表,在每个Hash位置下以链表的形式挂接位置信息,从而建立了索引模型。提出一种将四叉树进行编码压缩的索引方案——"线性Hash编码索引模型",消除了四叉树索引模型中父节点内存浪费问题。同时,查询速度从树形的O(log4n)降到了线性的0(1),得到很大地提高。 展开更多
关键词 k-mer 树形索引 hash索引 哈弗曼编码 概率模型
下载PDF
Hash索引算法综述 被引量:3
13
作者 颜文 陈征 《无线通信技术》 2019年第2期19-24,29,共7页
在这个数据量爆炸增长的时代,如何在海量数据中实现对所需数据快速精准的查找成为必须面对的难题。哈希索引(Hash Index)将数据相关值输入哈希函数中,通过哈希函数计算得到哈希码,从而找到数据对应的存储地址。这种方法大大提高了数据... 在这个数据量爆炸增长的时代,如何在海量数据中实现对所需数据快速精准的查找成为必须面对的难题。哈希索引(Hash Index)将数据相关值输入哈希函数中,通过哈希函数计算得到哈希码,从而找到数据对应的存储地址。这种方法大大提高了数据检索的速度和准确度并优化了存储空间结构,一定程度上解决了海量数据处理较慢的难题,因此被当今学者广为研究。本文将综述哈希索引的定义和特点,介绍哈希索引的传统算法和新兴算法,最后总结全文并展望未来的研究方向。 展开更多
关键词 哈希索引 哈希码 键值 数据检索
下载PDF
一种应用于搜索引擎URL检索的hash算法设计与实现 被引量:1
14
作者 李伟伟 贾志洋 周粉 《现代计算机》 2009年第4期113-115,共3页
针对MD5在搜索引擎URL检索中的应用,指出其不足之处,设计一种应用于搜索引擎URL索引的消息摘要算法,与MD5算法比较,该算法生成了较短的hash值,可以节约内存空间、提高检索效率,并且该算法可以充分利用可用的hash值域空间。
关键词 URL检索 hash函数 消息摘要 搜索引擎
下载PDF
IndexPeer:半结构化P2P系统资源发现模型及其DHT算法 被引量:1
15
作者 刘小虎 蒋从锋 李垦 《计算机应用研究》 CSCD 北大核心 2008年第6期1648-1651,共4页
提出了一种基于半结构化P2P系统的资源发现模型——IndexPeer模型。该模型采用三层索引结构,由下至上分别为virtual organization层、service peer层和indexpeer层。IndexPeer充分利用P2P系统中的节点性能差异,具有高效的查找功能,且对... 提出了一种基于半结构化P2P系统的资源发现模型——IndexPeer模型。该模型采用三层索引结构,由下至上分别为virtual organization层、service peer层和indexpeer层。IndexPeer充分利用P2P系统中的节点性能差异,具有高效的查找功能,且对网络的高度动态性有良好的适应性。针对Index Peer模型的体系结构,对该模型的结构化层DHT算法进行了研究和设计。基于small-world的仿真实验表明,IndexPeer模型的体系结构及其结构化层DHT算法具有较好的鲁棒性和一定的可扩展性。 展开更多
关键词 分布式哈希表 点对点系统 索引 资源发现 搜索
下载PDF
基于Hash索引的高通量基因序列比对并行加速技术研究 被引量:4
16
作者 王文迪 汤文 +3 位作者 段勃 张春明 张佩珩 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2463-2471,共9页
近年来随着高通量基因测序技术的迅速发展,测序成本和周期都得到了大幅降低.然而,新一代测序技术海量数据生成能力以及各类测序算法蕴含的高并发性却对现有计算机的运算能力提出了新挑战.以一个基于Hash索引算法实现的开源重测序程... 近年来随着高通量基因测序技术的迅速发展,测序成本和周期都得到了大幅降低.然而,新一代测序技术海量数据生成能力以及各类测序算法蕴含的高并发性却对现有计算机的运算能力提出了新挑战.以一个基于Hash索引算法实现的开源重测序程序(PerM)为例,研究了在商用多核CPU上加速该应用程序的关键技术.在一个64核SMP系统上的实验结果证明,提出的优化技术可以使Cache缺失率降低90%,性能提升4~11倍.接下来探讨了在一个包含XilinxLX330FPGA的加速卡上设计实现专用并行加速系统的相关问题.作为原型验证系统,在基于FPGA的PCIe加速卡上设计并实现了包含11个处理单元的脉动陈列并行计算系统.和IntelXeonX75508核CPU相比,提出的并行加速器有30~65倍性能功耗比优势. 展开更多
关键词 hash索引 生物信息学 高通量测序 FPGA 并行加速器
下载PDF
Hash表与B^+树相结合的高效目录索引结构 被引量:7
17
作者 刘贤焯 王劲林 +2 位作者 朱明 邓峰 孙鹏 《西安交通大学学报》 EI CAS CSCD 北大核心 2013年第4期105-111,共7页
针对目前文件系统目录结构在处理大量文件,尤其是单个大目录时文件创建、查找和删除速度较慢的问题,提出一种面向Web服务器存储系统的目录索引结构。该结构利用Hash函数对变长关键字的压缩特性和Hash表的O(1)查找复杂度进行文件名的快... 针对目前文件系统目录结构在处理大量文件,尤其是单个大目录时文件创建、查找和删除速度较慢的问题,提出一种面向Web服务器存储系统的目录索引结构。该结构利用Hash函数对变长关键字的压缩特性和Hash表的O(1)查找复杂度进行文件名的快速查找,并使用B+树高效索引目录的子索引节点。测试结果表明,该结构能够快速地处理大量文件,单个大文件夹下的文件查找速度相比Ext3提高了40%,文件创建、删除速度比Ext3和Reiserfs加快了73%。 展开更多
关键词 文件系统 目录索引 哈希表 B+树
下载PDF
基于Buddy^*-Hash的移动对象时空查询方法 被引量:4
18
作者 刘玥 郝忠孝 《计算机工程》 CAS CSCD 北大核心 2010年第4期47-49,共3页
索引技术可以提高数据检索和查询效率,为了实现对时空数据库中移动对象的查询操作,需要引入时空索引技术。在传统Buddy-树的基础上提出Buddy*-Hash索引结构,根据扩展查询窗口策略给出范围查询算法。实验结果表明,基于BH索引结构的范围... 索引技术可以提高数据检索和查询效率,为了实现对时空数据库中移动对象的查询操作,需要引入时空索引技术。在传统Buddy-树的基础上提出Buddy*-Hash索引结构,根据扩展查询窗口策略给出范围查询算法。实验结果表明,基于BH索引结构的范围查询算法具有良好性能。 展开更多
关键词 移动对象 索引结构 hash辅助索引表 范围查询
下载PDF
基于Hash+链表索引的专用型内存数据库系统的设计与实现
19
作者 黄炜 《电脑与信息技术》 2011年第3期52-55,共4页
文章研究了内存数据库管理系统的原理和关键技术,根据移动短信监控系统中内存数据库的特点,设计和实现了一个基于Hash+链表索引的专用型内存数据库系统,用于解决垃圾短信分析系统中海量短信的存取问题。
关键词 垃圾短信系统 内存数据库 hash索引
下载PDF
基于Hash表的数据库索引结构设计与实现 被引量:3
20
作者 汪超 何丕廉 李志明 《微处理机》 2007年第4期53-56,共4页
索引结构的优劣对RDBMS的查询速度起着至关重要的作用,目前比较成熟的组织索引的数据结构有Hash表和B-Tree结构。基于Hash表给出了一种RDBMS索引以及存储结构的详细设计方案并加以实现。
关键词 数据库 存储 索引 哈希表
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部