分档布鲁姆过滤器的查询算法被引量：14

Basket Bloom Filters for Membership Queries

下载PDF

导出

摘要布鲁姆过滤器是一种能够简洁地表示集合并支持集合查询的数据结构,广泛应用于数据库、网络和分布式系统中.针对现有的布鲁姆过滤器没有考虑查询失效代价这一缺陷,文中提出一种新的代价敏感的分档布鲁姆过滤器查询算法.它将元素根据不同的查询代价分为不同的子集,通过考查每档子集最低查询失效率的关系,建立由每档子集合最低查询失效假阳性概率表示的集合最低查询失效总代价目标函数,使用类目标函数梯度遗传算法获得每档的最优Hash函数个数ki,完成集合到向量的映射与查找.仿真实验结果表明,使用新结构的查询算法和标准布鲁姆过滤器算法相比,所用的查询计算时间基本相同,因为区分对待集合元素,查询失效总代价仅为标准算法的27%. A Bloom Filter is a space-efficient data structure allowing membership queries over sets with allowable errors. It is widely used in databases, networks, and distributed systems. This paper presents a novel Bloom Filter, called Basket Bloom Filter （BBF）. The BBF differentiates elements in a data set depending on their query invalidation cost, by clustering elements into different baskets. The total query invalidation cost function is defined. In order to minimize the total query invalidation cost, the genetic algorithm is employed to find the optimal number of hash functions for every basket. Simulation results show that, BBF＇s total query invalidation cost is 27% of the standard Bloom Filters＇ while the executing time is almost the same.

作者谢鲲闵应骅张大方谢高岗文吉刚

机构地区湖南大学计算机与通信学院中国科学院计算技术研究所网络与普适计算研究部湖南大学软件学院

出处《计算机学报》 EI CSCD 北大核心 2007年第4期597-607,共11页 Chinese Journal of Computers

基金国家自然科学基金(60473031 60273070 60403031 90604015) 国家"八六三"高技术研究发展计划项目基金(2005AA121560) 湖南省科技计划项目基金(2006GK3101)资助.

关键词分档布鲁姆过滤器计算机网络分布式计算分布式消息系统集合元素查询 Basket Bloom Filter computer networks distributed computing distributed information system membership query

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献24

1Bloom B.Space/time trade-offs in hash coding with allowable errors.Communications of the ACM,1970,13(7):422-426
2Mullin J K.Optimal semijoins for distributed database systems.IEEE Transactions on Software Engineering,1990,16(5):558-560
3McIlroy M.Development of a spelling list.IEEE Transactions on Communications,1982,30(1):91-99
4Druschel P,Rowstron A.PAST,a large-scale,persistent peer-to-peer storage utility//Proceedings of the 8th Workshop on Hot Topics in Operations Systems.Elmau/Oberbayern,Germany,2001.Washington,DC,USA,2001:65-70
5Stoica I,Morris R,Karger D et al.Chord:A scalable peerto-peer lookup service for Internet applications//Proceedings of the ACM SIGCOMM.San Francisco,USA,2001:149-160
6Ratnasamy S,Francis P,Handley M et al.A scalable content-addressable network//Proceedings of the ACM SIGCOMM.San Francisco,2001:161-172
7Rhea S C,Kubiatowicz J.Probabilistic location and routing//Proceedings of the INFOCOM2002.New York,2002.Washington,DC,USA,2002:1248-1257
8Whitaker A,Wetherall D.Forwarding without loops in Icarus//Proceedings of the Open Architectures and Network Programming.New York,USA,2002:63-75
9Wu-Chan F,Shin K G,Kandlur D D et al.The BLUE active queue management algorithms.IEEE/ACM Transactions on Networking,2002,10(4):513-528
10Estan C,Varghese G.New directions in trace measurement and accounting//Proceedings of the ACM SIGCOMM.Pittsburgh,USA,2002:323-336.

二级参考文献7

1玄光男程润伟.遗传算法与工程设计[M].北京:科学出版社,2000..
2陈国良王煦法等.遗传算法及其应用[M].北京:人民邮电出版社,1999,5.433.
3玄光男，遗传算法与工程设计，2000年
4陈国良，遗传算法及其应用，1999年
5林永旺,张大江,钱华林.一个基于集中管理的协作式Web缓存系统[J].计算机研究与发展,2001,38(1):68-73. 被引量：16
6王本年,曹先彬.一种域分布式合作Web缓存系统[J].计算机研究与发展,2002,39(3):275-279. 被引量：2
7郝沁汾,祝明发,郝继升.一种新的代理缓存替换策略[J].计算机研究与发展,2002,39(10):1178-1185. 被引量：16

共引文献39

1滕皓,邵阔义,曹爱增,杨炳儒.量子遗传算法的变尺度混沌优化策略研究[J].计算机应用研究,2009,26(2):543-545. 被引量：5
2魏发远,李世其.基于混合遗传算法的多目标动态优化设计[J].宇航学报,2004,25(6):609-615. 被引量：8
3郭家堂,郭厚焜,王勇,吕镇,卢伟海.遗传算法在集中管理式Web缓存系统的应用[J].华东交通大学学报,2005,22(1):107-110.
4张楠,李志蜀,张建华,李奇.基于混沌理论的免疫遗传算法[J].计算机应用,2006,26(5):1111-1112. 被引量：7
5李士勇,李盼池.基于实数编码和目标函数梯度的量子遗传算法[J].哈尔滨工业大学学报,2006,38(8):1216-1218. 被引量：60
6韩向春,郭婷婷,林星宇,丰保杰.集群缓存系统中代理缓存技术的研究[J].计算机工程与设计,2006,27(20):3842-3845. 被引量：3
7宋晓霞.遗传算法中初始群体技术的改进与实现[J].计算机工程与设计,2007,28(22):5485-5487. 被引量：5
8朱灿,梁昔明.一种多精英保存策略的遗传算法[J].计算机应用,2008,28(4):939-941. 被引量：23
9葛继科,邱玉辉,吴春明,蒲国林.遗传算法研究综述[J].计算机应用研究,2008,25(10):2911-2916. 被引量：415
10朱灿,梁昔明,颜东煌.一种考虑性别特征的遗传算法[J].武汉理工大学学报,2008,30(12):110-113. 被引量：3

同被引文献139

1田春虎.国内语义Web研究综述[J].情报学报,2005,24(2):243-249. 被引量：37
2龚俭,彭艳兵,杨望,刘卫江.基于BloomFilter的大规模异常TCP连接参数再现方法[J].软件学报,2006,17(3):434-444. 被引量：24
3吴丽辉,白硕,张刚,张凯.Web信息采集中的哈希函数比较[J].小型微型计算机系统,2006,27(4):673-676. 被引量：8
4彭艳兵,龚俭,刘卫江,杨望.Bloom Filter哈希空间的元素还原[J].电子学报,2006,34(5):822-827. 被引量：7
5池静,倪健,王华,邢秀娥.Bloom Filter和Weighted Bloom Filter的比较与研究[J].河北师范大学学报（自然科学版）,2006,30(4):398-402. 被引量：4
6陈伟,何炎祥,彭文灵.一种轻量级的拒绝服务攻击检测方法[J].计算机学报,2006,29(8):1392-1400. 被引量：26
7谢鲲,张大方,谢高岗,文吉刚.基于轨迹标签的无结构P2P副本一致性维护算法[J].软件学报,2007,18(1):105-116. 被引量：23
8叶明江,崔勇,徐恪,吴建平.基于有状态Bloom filter引擎的高速分组检测[J].软件学报,2007,18(1):117-126. 被引量：13
9WANG Bang-ju,WANG Yu-hua,NIU Li-ping,ZHANG Huan-guo.Pseudo Random Number Generator Based on Back Propagation Neural Network[J].Semiconductor Photonics and Technology,2007,13(2):164-168. 被引量：3
10段迅,李坚石.一种距离加权Bloom Filter的网络路由机制[J].微电子学与计算机,2007,24(5):73-75. 被引量：2

引证文献14

1谢鲲,秦拯,文吉刚,张大方,谢高岗.联合多维布鲁姆过滤器查询算法[J].通信学报,2008,29(1):56-64. 被引量：8
2丁振国,吴宝贵,辛友强.基于Bloom Filter的大规模网页去重策略研究[J].现代图书情报技术,2008(3):45-50. 被引量：15
3谢鲲,张大方,文吉刚,谢高岗,尤志强.布鲁姆过滤器代数运算探讨[J].电子学报,2008,36(5):869-874. 被引量：8
4谢鲲,文吉刚,张大方,谢高岗.布鲁姆过滤器查询算法[J].软件学报,2009,20(1):96-108. 被引量：34
5高家利,廖晓峰.改进的Bloom Filter算法及其性能分析[J].计算机工程与设计,2009,30(3):763-766.
6谢鲲,文吉刚,张大方,谢高岗.基于布鲁姆过滤器距离的集合变动定量评估算法[J].小型微型计算机系统,2009,30(3):411-416. 被引量：1
7苏国荣,杨岳湘,邓劲生.一种去除重复URL的算法[J].广西师范大学学报（自然科学版）,2010,28(1):122-126. 被引量：4
8张震,汪斌强,陈庶樵,朱珂.基于多维计数型布鲁姆过滤器的大流检测机制[J].电子与信息学报,2010,32(7):1608-1613. 被引量：9
9张伟,王汝传.Bloom Filters散列函数数目多阶段动态优化算法[J].电子学报,2011,39(4):877-881. 被引量：1
10张震,汪斌强,陈庶樵,郭通.几何布鲁姆过滤器的设计与分析[J].电子学报,2012,40(9):1852-1857. 被引量：4

二级引证文献82

1王伟晨.基于布隆过滤器算法的数据检索误判率研究[J].计算机产品与流通,2020,0(3):260-261. 被引量：2
2邱军,徐红梅.云计算在区域医疗信息化中的应用探索[J].新一代信息技术,2022,5(8):83-86. 被引量：1
3潘登,张大方,谢鲲,张继.一种基于折半层次搜索的包分类算法[J].计算机应用,2009,29(2):500-502. 被引量：3
4徐娜,刘四维,汪翔,倪卫明.基于Bloom Filter的网页去重算法[J].微型电脑应用,2011(3):48-51. 被引量：6
5贾志洋,高炜,王勇刚.结合信息检索技术的半监督文本分类方法[J].苏州大学学报（自然科学版）,2012,28(1):34-39. 被引量：1
6谢鲲,文吉刚,张大方,谢高岗.布鲁姆过滤器查询算法[J].软件学报,2009,20(1):96-108. 被引量：34
7高家利,廖晓峰.改进的Bloom Filter算法及其性能分析[J].计算机工程与设计,2009,30(3):763-766.
8高家利,廖晓峰.Bloom搜索过滤器的优化设计与实现[J].计算机工程,2009,35(7):264-266. 被引量：1
9彭林,谢伦国,张小强.事务存储中的一种自适应冲突检测算法[J].计算机工程与科学,2009,31(11):69-72. 被引量：2
10严华云,关佶红.Bloom Filter研究进展[J].电信科学,2010,26(2):31-36. 被引量：10

1谢鲲,张大方,文吉刚,谢高岗,尤志强.布鲁姆过滤器代数运算探讨[J].电子学报,2008,36(5):869-874. 被引量：8
2谢鲲,秦拯,文吉刚,张大方,谢高岗.联合多维布鲁姆过滤器查询算法[J].通信学报,2008,29(1):56-64. 被引量：8
3席晔文,杨金民.基于双布鲁姆过滤器的数据排重技术[J].计算机工程与应用,2014,50(23):198-202. 被引量：2
4程聂,黄昆,苏欣,张大方.一种基于树形结构的布鲁姆过滤器[J].计算机工程与科学,2012,34(2):19-24. 被引量：1
5田小梅,胡灿.布鲁姆过滤器算法在P2P系统中的应用[J].湖南环境生物职业技术学院学报,2012,18(4):26-29.
6景会成,张建伟.基于布鲁姆过滤器的RFID中间件数据过滤算法设计[J].河北联合大学学报（自然科学版）,2014,36(1):56-60. 被引量：1
7樊剑.坏道拷贝,抢救宝贵的数据[J].计算机应用文摘,2010(23):44-45.
8指尖的战斗[J].微型计算机,2010(11):86-89.
9张文增,孙振国,赵冬斌,陈强.基于Web数据库的子集合查询技术[J].计算机应用,2002,22(1):53-55.
10金石.别把有用文件当病毒[J].电脑时空,2004(11):69-69.

计算机学报

2007年第4期

浏览历史

内容加载中请稍等...

分档布鲁姆过滤器的查询算法被引量：14

参考文献24

二级参考文献7

共引文献39

同被引文献139

引证文献14

二级引证文献82

相关作者

相关机构

相关主题

浏览历史

分档布鲁姆过滤器的查询算法 被引量：14

参考文献24

二级参考文献7

共引文献39

同被引文献139

引证文献14

二级引证文献82

相关作者

相关机构

相关主题

浏览历史

分档布鲁姆过滤器的查询算法被引量：14