期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
A Survey of Bitmap Index Compression Algorithms for Big Data 被引量:5
1
作者 Zhen Chen Yuhao Wen +6 位作者 Junwei Cao Wenxun Zheng Jiahui Chang Yinjun Wu Ge Ma Mourad Hakmaoui Guodong Peng 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2015年第1期100-115,共16页
With the growing popularity of Internet applications and the widespread use of mobile Internet, Internet traffic has maintained rapid growth over the past two decades. Internet Traffic Archival Systems(ITAS) for pac... With the growing popularity of Internet applications and the widespread use of mobile Internet, Internet traffic has maintained rapid growth over the past two decades. Internet Traffic Archival Systems(ITAS) for packets or flow records have become more and more widely used in network monitoring, network troubleshooting, and user behavior and experience analysis. Among the three key technologies in ITAS, we focus on bitmap index compression algorithm and give a detailed survey in this paper. The current state-of-the-art bitmap index encoding schemes include: BBC, WAH, PLWAH, EWAH, PWAH, CONCISE, COMPAX, VLC, DF-WAH, and VAL-WAH. Based on differences in segmentation, chunking, merge compress, and Near Identical(NI) features, we provide a thorough categorization of the state-of-the-art bitmap index compression algorithms. We also propose some new bitmap index encoding algorithms, such as SECOMPAX, ICX, MASC, and PLWAH+, and present the state diagrams for their encoding algorithms. We then evaluate their CPU and GPU implementations with a real Internet trace from CAIDA. Finally, we summarize and discuss the future direction of bitmap index compression algorithms. Beyond the application in network security and network forensic, bitmap index compression with faster bitwise-logical operations and reduced search space is widely used in analysis in genome data, geographical information system, graph databases, image retrieval, Internet of things, etc. It is expected that bitmap index compression will thrive and be prosperous again in Big Data era since 1980s. 展开更多
关键词 Internet traffic big data traffic archival network security bitmap index bitmap compression algorithm
原文传递
COMBAT:A New Bitmap Index Coding Algorithm for Big Data
2
作者 Yinjun Wu Zhen Chen +2 位作者 Yuhao Wen Wenxun Zheng Junwei Cao 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2016年第2期136-145,共10页
Bitmap indexing has been widely used in various applications due to its speed in bitwise operations. However, it can consume large amounts of memory. To solve this problem, various bitmap coding algorithms have been p... Bitmap indexing has been widely used in various applications due to its speed in bitwise operations. However, it can consume large amounts of memory. To solve this problem, various bitmap coding algorithms have been proposed. In this paper, we present COMbining Binary And Ternary encoding (COMBAT), a new bitmap index coding algorithm. Typical algorithms derived from Word Aligned Hybrid (WAH) are COMPressed Adaptive indeX (COMPAX) and Compressed "n" Composable Integer Set (CONCISE), which can combine either two or three continuous words after WAH encoding. COMBAT combines both mechanisms and results in more compact bitmap indexes. Moreover, querying time of COMBAT can be faster than that of COMPAX and CONCISE, since bitmap indexes are smaller and it would take less time to load them into memory. To prove the advantages of COMBAT, we extend a theoretical analysis model proposed by our group, which is composed of the analysis of various possible bitmap indexes. Some experimental results based on real data are also provided, which show COMBAT's storage and speed superiority. Our results demonstrate the advantages of COMBAT and codeword statistics are provided to solidify the proof. 展开更多
关键词 bitmap index big data COMBAT CONCISE COMPAX index encoding performance evaluation
原文传递
Bitmap lattice index in road networks
3
作者 Doohee Song Keun-Ho Lee Kwangjin Park 《Journal of Central South University》 SCIE EI CAS 2014年第10期3856-3863,共8页
A novel technique called the bitmap lattice index(BLI) is proposed, which combines the advantages of a wireless broadcasting environment with a road network. Existing road networks are based on the on-demand method: a... A novel technique called the bitmap lattice index(BLI) is proposed, which combines the advantages of a wireless broadcasting environment with a road network. Existing road networks are based on the on-demand method: a server's workload increases as the query request increases when a server sends a client information. To solve this problem, we propose the BLI. The BLI denotes an object and a node as 0 and 1 in the Hilbert curve(HC) map. The BLI can identify the position of a node and an object through bit information; it can also reduce the broadcasting frequency of a server by reducing the size of the index, thereby decreasing the access latency and query processing times. Moreover, the BLI is highly effective for data filtering, as it can identify the positions of both an object and a node. In a road network, if filtering is done via the Euclidean distance, it may result in an error. To prevent this, we add another validation procedure. The experiment is conducted by applying the BLI to kNN query, and the technique is assessed by a performance evaluation experiment. 展开更多
关键词 road network wireless broadcast spatial query bitmap lattice index(BLI)
下载PDF
基于Bitmap时间区间查询算法及其在智能会议管理中的应用
4
作者 李光华 张洪涛 《自动化技术与应用》 2023年第6期108-111,149,共5页
为了解决时间区间查询算法耗时较长的问题,提出一种基于Bitmap时间区间查询算法。首先对时间区间序列数据编码得到有界Bitmap,分析其相似性度量,并优化搜索终止条件,然后基于S-tree索引结构设计了最佳优先搜索算法。实验结果表明,与现... 为了解决时间区间查询算法耗时较长的问题,提出一种基于Bitmap时间区间查询算法。首先对时间区间序列数据编码得到有界Bitmap,分析其相似性度量,并优化搜索终止条件,然后基于S-tree索引结构设计了最佳优先搜索算法。实验结果表明,与现有的滑动时间窗口算法和传统Bitmap查询算法相比,本文算法查询耗时较少,具有良好的有效性和高效性。 展开更多
关键词 时间区间序列 bitmap编码 S-tree索引
下载PDF
一种基于Bitmap的活动时间冲突查询算法 被引量:2
5
作者 沈瑛 陈望远 +4 位作者 侯晨煜 徐锦婷 曹斌 董天阳 范菁 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第11期2738-2744,共7页
提出1种基于Bitmap的活动时间冲突查询算法。首先对原始数据预处理以构建Bitmap索引结构,然后构建两阶段查询算法:第1阶段遍历Bitmap索引得到满足各个活动持续时间的候选时间区间和候选用户集合,并过滤其中的无效用户、调整候选时间;第... 提出1种基于Bitmap的活动时间冲突查询算法。首先对原始数据预处理以构建Bitmap索引结构,然后构建两阶段查询算法:第1阶段遍历Bitmap索引得到满足各个活动持续时间的候选时间区间和候选用户集合,并过滤其中的无效用户、调整候选时间;第2阶段完成冲突区间组合优化,获得不冲突条件下活动组织的全局最优方案;最后,以8 628个用户的50 000条真实数据(时间跨度为1月)进行实验,分为单活动及多活动场景,以用户数量、时间范围、活动数量、持续时间等为测试指标,对比本文算法与滑动时间窗口法测试结果。研究结果表明:本文提出的算法能够满足大规模、涉及时间冲突的活动组织查询的时效性要求,该算法查询速度比滑动时间窗口法的查询速度快,单活动场景下其查询响应速度约为滑动时间窗口法的100倍。 展开更多
关键词 查询服务 活动时间冲突 bitmap索引 全局最优 时间区间
下载PDF
基于位图的键值存储哈希优化 被引量:1
6
作者 王天宇 徐云 王彪 《计算机应用研究》 CSCD 北大核心 2023年第7期2106-2110,共5页
内存键值存储系统中索引方法决定了系统的时间性能和空间开销,是改进和优化的关键因素。哈希索引提供了O(1)时间复杂度的访问操作,但会产生存储冲突,引起访问性能下降。为此,提出了一种基于位图的键值存储哈希优化方法,可以避免存储冲... 内存键值存储系统中索引方法决定了系统的时间性能和空间开销,是改进和优化的关键因素。哈希索引提供了O(1)时间复杂度的访问操作,但会产生存储冲突,引起访问性能下降。为此,提出了一种基于位图的键值存储哈希优化方法,可以避免存储冲突提升访问性能。该方法将共前缀的键哈希到同一个块,减少键存储空间;在块内使用层次位图结构,全域位图表示所有键的后缀部分来避免存储冲突,摘要位图支持快速定位和范围查询加速。实验结果表明,优化后的哈希索引在多种负载上均能取得较高吞吐量并具有良好的并发性能,同时内存占用较现有方案大大降低。 展开更多
关键词 内存键值存储 索引结构 哈希表 位图
下载PDF
分片位图索引:一种适用于云数据管理的辅助索引机制 被引量:30
7
作者 孟必平 王腾蛟 +1 位作者 李红燕 杨冬青 《计算机学报》 EI CSCD 北大核心 2012年第11期2306-2316,共11页
云计算技术的快速发展为海量数据的存储和管理提供了可能.然而,由于存储模型的根本改变,传统关系数据库管理系统中成熟的索引技术既不能直接应用于海量数据的处理,也无法被简单地迁移到云计算环境中.通过分析对比辅助索引在云环境中的... 云计算技术的快速发展为海量数据的存储和管理提供了可能.然而,由于存储模型的根本改变,传统关系数据库管理系统中成熟的索引技术既不能直接应用于海量数据的处理,也无法被简单地迁移到云计算环境中.通过分析对比辅助索引在云环境中的两种截然不同的基本逻辑结构,即集中式方案与分布式方案,在吸收两者的优势并规避其弱点的基础上,提出了具有良好可扩展性的分片位图索引机制,从而对云环境中海量数据的检索任务提供高效的支持.通过充分利用云环境中的并行计算资源,使单条查询的响应速度得到提升;与此同时,局部节点根据其所掌握的全局信息规避了不必要的检索开销从而使大量请求并发到达时的查询吞吐量得以保证.在真实数据上进行实验的结果表明,分片位图索引的查询性能大大优于其它方法. 展开更多
关键词 云计算环境 辅助索引 集中式方案 分布式方案 分片位图索引
下载PDF
云格环境下基于P2P的动态资源发现机制 被引量:5
8
作者 曾志 刘仁义 +1 位作者 杜震洪 张丰 《浙江大学学报(理学版)》 CAS CSCD 2013年第4期463-468,共6页
为在云计算平台上实现大数据的高效并行处理与访问,针对动态增长的异构资源所具有的集成与共享所形成的超强计算力结合网格计算,从基于服务计算的角度分析了云计算与网格计算2个不同框架体系的集成问题,探讨了一种资源与服务的统一描述... 为在云计算平台上实现大数据的高效并行处理与访问,针对动态增长的异构资源所具有的集成与共享所形成的超强计算力结合网格计算,从基于服务计算的角度分析了云计算与网格计算2个不同框架体系的集成问题,探讨了一种资源与服务的统一描述机制,提出了云格体系下的一种分组生成树的P2P网络动态资源与服务发现算法,可实现海量数据的高效处理与访问.实验表明该算法具有一定的可行性与针对性. 展开更多
关键词 网格与云计算 P2P 位图索引 生成树结构 资源发现
下载PDF
利用位图索引加速大规模科学数据按需访问 被引量:4
9
作者 夏芳 陈虹 +1 位作者 曹立强 沈卫超 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期94-99,共6页
在分析TB及以上规模复杂科学数据时,实现关键数据的快速定位是一项非常具有挑战性的任务.通过引进目前国际最新位图索引技术,设计并实现科学数据按需访问软件系统,综合利用分段、编码、WAH压缩等位图索引改进策略,减少索引尺寸规模和查... 在分析TB及以上规模复杂科学数据时,实现关键数据的快速定位是一项非常具有挑战性的任务.通过引进目前国际最新位图索引技术,设计并实现科学数据按需访问软件系统,综合利用分段、编码、WAH压缩等位图索引改进策略,减少索引尺寸规模和查询响应时间.通过实际数据性能结果表明,此方法可以将大规模科学数据的按需访问速度提高2~10倍. 展开更多
关键词 科学数据 按需访问 位图索引 查询处理
下载PDF
位图索引及其在数据仓库中的应用研究 被引量:6
10
作者 万怀宇 黄厚宽 《铁路计算机应用》 2006年第12期31-33,共3页
介绍位图索引的原理及其在数据仓库中的应用,对位图索引的概念、特征、查询操作、编码压缩以及维护作了较为详细的描述,以便于在数据仓库中正确地使用位图索引,提高数据仓库的处理性能。
关键词 数据仓库 位图索引 应用 研究
下载PDF
一种高效的海量电力暂态数据索引方法 被引量:2
11
作者 陈永艳 束洪春 +1 位作者 董俊 曹璞璘 《电力系统自动化》 EI CSCD 北大核心 2015年第14期126-132,共7页
随着故障录波和行波装置的广泛应用和技术进步,IEEE COMTRADE 1999格式暂态数据(简称COMTRADE数据)已经呈现出海量化发展的趋势。如何对海量COMTRADE数据进行快速检索和分析也成为当前亟待解决的问题。文中研究并设计了一种高效的索引框... 随着故障录波和行波装置的广泛应用和技术进步,IEEE COMTRADE 1999格式暂态数据(简称COMTRADE数据)已经呈现出海量化发展的趋势。如何对海量COMTRADE数据进行快速检索和分析也成为当前亟待解决的问题。文中研究并设计了一种高效的索引框架,该框架构建了以词对齐混合编码(WAH)为基础的位图索引,通过对COMTRADE数据构建元数据并建立相关索引,能够实现高速的电力数据检索,可以解决传统搜索技术的性能问题。该框架通过引入两阶段提交协议(2PC)来保证原始数据和元数据,元数据和索引文件的一致性。在与传统的MySQL关系数据库的比较测试中,所提方法性能更为优越,特别在对多维数据多条件和浮点数检索时,优势更为明显。该框架能够满足当前海量COMTRADE数据检索的需要,并可应用于电力行业其他大数据的存储检索和分析。 展开更多
关键词 COMTRADE数据 海量数据 位图索引 词对齐混合编码
下载PDF
CB-LSH:基于压缩位图的高性能LSH索引算法 被引量:2
12
作者 吴羽 寿黎但 陈刚 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第3期377-385,共9页
由于传统局部敏感散列(LSH)算法的删除性能不足,阻碍了LSH算法在实际产品中的应用.提出一种基于压缩位图的改进方法,通过引入压缩位图改良传统LSH算法的桶中数据结构,以及使用标记清除策略进行算法流程优化,解决传统LSH索引实时删除性... 由于传统局部敏感散列(LSH)算法的删除性能不足,阻碍了LSH算法在实际产品中的应用.提出一种基于压缩位图的改进方法,通过引入压缩位图改良传统LSH算法的桶中数据结构,以及使用标记清除策略进行算法流程优化,解决传统LSH索引实时删除性能差的问题.理论分析证明:基于压缩位图的LSH(CB-LSH)算法可以显著降低算法的空间复杂度和时间复杂度.实验结果支撑了理论分析的结论,相对于传统LSH算法,CB-LSH在降低内存消耗的同时,可显著提高索引删除、数据插入和数据查询的性能.在大型项目中的应用实践验证了在线实时更新的海量多媒体数据检索系统中,CB-LSH索引算法对于多媒体数据的高维索引是有效可行的,并显著提升了性能、降低了资源消耗. 展开更多
关键词 位图索引 局部敏感散列 高维索引 在线更新
下载PDF
电子海图空间数据索引结构及检索算法研究 被引量:3
13
作者 李刚 赵玉新 李磊 《中国航海》 CSCD 北大核心 2006年第2期4-7,共4页
电子海图系统是一种信息显示系统,电子海图数据的格式种类繁多,为使系统支持不同格式的海图数据、实现通用性,提出一种具有一定适应能力的空间数据索引结构,该结构能访问已有的大多数海图格式。另外提出建立区间分解检索机制,采用B+树... 电子海图系统是一种信息显示系统,电子海图数据的格式种类繁多,为使系统支持不同格式的海图数据、实现通用性,提出一种具有一定适应能力的空间数据索引结构,该结构能访问已有的大多数海图格式。另外提出建立区间分解检索机制,采用B+树结构快速搜索出满足用户要求的海图。最后针对海图显示速度慢的问题,引入位映像图检索算法以提高显示速度。 展开更多
关键词 水路运输 电子海图 空间索引 数据结构 区间分解 位映像图 检索算法
下载PDF
列存储数据库中压缩位图索引技术 被引量:2
14
作者 王梅 杨思箫 乐嘉锦 《计算机工程》 CAS CSCD 2012年第18期26-29,共4页
为提高压缩码的利用率,提出一种适用于列存储数据库的压缩位图索引技术。定义反转、合并等操作,将所有计算的输入值与输出值格式化为位向量形式。通过活跃度衡量索引中位向量的复杂度,并对压缩位向量进行直接计算,优化where子句和group... 为提高压缩码的利用率,提出一种适用于列存储数据库的压缩位图索引技术。定义反转、合并等操作,将所有计算的输入值与输出值格式化为位向量形式。通过活跃度衡量索引中位向量的复杂度,并对压缩位向量进行直接计算,优化where子句和group by子句在查询执行过程中的数据提取。在SSB数据集上的实验结果证明,该技术能提高29.7%~38.9%的压缩位图索引性能。 展开更多
关键词 列存储数据库 位图索引 活跃度 SSB数据集 聚集查询
下载PDF
结合分段位图和B^+树的云数据索引机制研究 被引量:1
15
作者 贺智明 张慧云 毛伊敏 《计算机应用研究》 CSCD 北大核心 2016年第12期3735-3738,共4页
针对位图索引数据存储空间大、检索效率低的问题,提出了一种结合分段位图和B^+树的云数据索引机制(BBI)。BBI在索引创建时按照一定的基数对元组数据进行分段,以段为单位建立位图索引,索引数据量的决定因子由属性值的取值范围转变为分段... 针对位图索引数据存储空间大、检索效率低的问题,提出了一种结合分段位图和B^+树的云数据索引机制(BBI)。BBI在索引创建时按照一定的基数对元组数据进行分段,以段为单位建立位图索引,索引数据量的决定因子由属性值的取值范围转变为分段数与基数的乘积,大大减少了索引数据量;同时,在每个数据节点上建立B^+树,避免了数据检索时对非结果数据的逐个遍历,从而显著提高了数据检索效率。实验结果表明,BBI索引是一种性能较优的云数据索引机制。 展开更多
关键词 云数据索引 分段位图索引 B+树 并行执行 索引排序
下载PDF
基于内存的分布式隐私流查询系统 被引量:1
16
作者 张鹏 刘庆云 +3 位作者 熊翠文 李保珲 林海轮 易立 《计算机研究与发展》 EI CSCD 北大核心 2014年第S2期48-56,共9页
随着大数据时代的到来,隐私问题备受关注,用户一方面希望获得新鲜和低延迟的查询结果,另一方面又希望对查询信息进行隐私保护,为此提出了一种基于内存的分布式隐私流查询系统.其中,查询可以通过Paillier密码系统进行加密.该系统在shared... 随着大数据时代的到来,隐私问题备受关注,用户一方面希望获得新鲜和低延迟的查询结果,另一方面又希望对查询信息进行隐私保护,为此提出了一种基于内存的分布式隐私流查询系统.其中,查询可以通过Paillier密码系统进行加密.该系统在shared-nothing架构下支持水平扩展,实现了在内存中对流数据进行分片的并行查询以及基于位图索引的压缩存储.实验证明了该系统的有效性. 展开更多
关键词 隐私流查询 内存计算 Paillier密码系统 位图索引 大数据
下载PDF
ROLAP中星型模型的索引优化策略 被引量:1
17
作者 田忠和 张霞 《计算机应用》 CSCD 北大核心 2004年第6期63-65,共3页
目前主要有三种方法来提高ROLAP查询效率:聚集策略、即席查询策略以及采用高性能软硬件并行计算机系统结构。文中以暂住人口数据仓库为例,阐述如何利用索引来提高ROLAP的查询效率。主要讨论了位图索引和数据索引对ROLAP的查询优化,并从... 目前主要有三种方法来提高ROLAP查询效率:聚集策略、即席查询策略以及采用高性能软硬件并行计算机系统结构。文中以暂住人口数据仓库为例,阐述如何利用索引来提高ROLAP的查询效率。主要讨论了位图索引和数据索引对ROLAP的查询优化,并从查询时间的长短以及数据占用存储空间的大小来比较这两种方法的优缺点。 展开更多
关键词 ROLAP 数据仓库 位图索引 数据索引 基本数据索引
下载PDF
一种采用双向有序链表存储的动态编码位图索引方法 被引量:1
18
作者 王书海 刘桂兰 綦朝晖 《石家庄铁道大学学报(自然科学版)》 2015年第2期95-101,共7页
位图索引依据其独特的位向量编码方式,在数据检索中得到广泛使用。在对比分析位图索引结构中的简单位图索引和编码位图索引的基础上,提出了一种新的基于双向有序链表存储的动态编码位图索引方法,并给出了这一动态编码位图索引方法在数... 位图索引依据其独特的位向量编码方式,在数据检索中得到广泛使用。在对比分析位图索引结构中的简单位图索引和编码位图索引的基础上,提出了一种新的基于双向有序链表存储的动态编码位图索引方法,并给出了这一动态编码位图索引方法在数据插入、删除、更新和检索中的详细算法。最后,进行实验测试。结果表明,所提出的索引方法具有更好的执行效率。 展开更多
关键词 位图索引 简单位图索引 编码位图索引 双向有序链表
下载PDF
基于P2P框架的网格资源发现算法研究 被引量:1
19
作者 郑秀颖 常桂然 田翠华 《计算机技术与发展》 2008年第5期123-125,130,共4页
由于资源数量的巨大,典型网格系统中的资源发现问题就成为关键,而现有网格中有许多的资源发现算法主要是集中或分层方法。P2P已经被认为是一种合适的分布式模型,它具有动态性、可伸缩等优点。在现有网格之上提出了一个P2P虚拟层,并据此... 由于资源数量的巨大,典型网格系统中的资源发现问题就成为关键,而现有网格中有许多的资源发现算法主要是集中或分层方法。P2P已经被认为是一种合适的分布式模型,它具有动态性、可伸缩等优点。在现有网格之上提出了一个P2P虚拟层,并据此提出了一个用于网格资源发现的分布式算法,从而解决现有网格系统中资源发现效率低、性能差、不具有伸缩性和可扩展性等一系列问题。 展开更多
关键词 P2P 位图索引 资源发现
下载PDF
用改进的游程编码方法压缩值索引 被引量:1
20
作者 陈富强 奚建清 《计算机工程与应用》 CSCD 北大核心 2008年第19期140-141,共2页
为了进一步提高采用游程编码方法压缩值索引的效率,针对原有方法的不足之处,采取了两个改进措施,一是在索引前排序被索引的数据表使得值索引中的0串和1串更长,二是改进现有编码算法使之可以同时压缩0串和1串。实验结果表明,采用改进后... 为了进一步提高采用游程编码方法压缩值索引的效率,针对原有方法的不足之处,采取了两个改进措施,一是在索引前排序被索引的数据表使得值索引中的0串和1串更长,二是改进现有编码算法使之可以同时压缩0串和1串。实验结果表明,采用改进后方法压缩值索引形成的压缩文件体积仅为采用原有方法时的11.83%。 展开更多
关键词 值索引 游程编码 位图索引
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部