海量数据库中实时包的判重算法被引量：2

Algorithm for Judging Duplicate Real-time Packet in Massive Database

下载PDF

导出

摘要关系数据库中的索引技术可以快速判断记录重复,但对于频繁更新的海量数据库,维护索引的时间与资源开销较大。针对交通量数据包及其海量数据库的特点,提出一个交通量实时包的时序区间模型,给出并证明了一个基于区间记录的快速判重算法,分析了算法的复杂度,探讨了改进算法的方法。该算法具有复杂度与数据库大小无关、高效、易于实现等特点。 The index technique in relational database can judge rapidly a duplicate record. But the cost of time and resource is more for maintaining the index in massiye database when its records updates frequently. Considering the characteristic of traffic packet and traffic massive database, this paper puts forward a time order interval model for trafl＇ic real-time packet, gives and proves an algorithm for rapidly judging a duplicate packet based on interval records, analyses the algorithm complexity, and discusses several improved methods. The algorithm introduced here has the characteristic that the complexity is independent on the database size, the efficiency is high, and can be realized easily.

作者张立芳

机构地区长沙理工大学计算机与通信工程学院

出处《计算机工程》 CAS CSCD 北大核心 2008年第21期76-77,80,共3页 Computer Engineering

基金湖南省交通厅科研基金资助项目(200610)

关键词海量数据库重复公路交通量实时包 massive database duplicate highway traffic real-time packet

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1交通部规划研究院.公路交通量调查设备与数据服务中心基础交通数据通讯协议(06年修定稿)[EB/OL].(2006—03-10).http://jd.tpri.gov.cn/gzjl/bzgf.jsp.
2于胜英.进一步完善交通量和运输量统计体系建设为公路水路交通发展提供有力的信息支撑[EB/OL].(2006-04).http://jd.tpri.gov.cn/gzjl/2006jtljh.htm.
3朱恒民,王宁生.一种改进的相似重复记录检测方法[J].控制与决策,2006,21(7):805-808. 被引量：12
4邱越峰,田增平,季文贇,周傲英.一种高效的检测相似重复记录的方法[J].计算机学报,2001,24(1):69-77. 被引量：72
5Mannino M V.数据库设计、应用开发与管理[M].2版.唐常杰,译.北京:电子工业出版社,2005.
6胡百敬.Microsoft SQL Server性能调校[M].北京:电子工业出版社,2004.

二级参考文献18

1[1]Bitton D， DeWitt D J. Duplicate record elimination in large data files. ACM Trans Database Systems, 1983, 8(2):255-65
2[2]Hernandez M， Stolfo S. The Merge/Purge problem for large databases. In: Proc ACM SIGMOD International Conference on Management of Data, 1995. 127-138
3[3]Howard B Newcombe, Kennedy J M, Axford S J, James A P. Automatic linkage of vital records. Science, 1959, 130:954-959
4[4]DeWitt D J, Naught J F, Schneider D A. An evaluation of non-equijoin algorithms. In: Proc 17th International Conference on Very Large Databases, Barcelona, Spain, 1991. 443-452
5[5]Hylton J A. Identifying and merging related bibliographic records[MS dissertation]. MIT: MIT Laboratory for Computer Science Technical Report 678， 1996
6[6]Monge A E， Elkan C P. An efficient domain-independent algorithm for detecting approximately duplicate database records. In: Proc DMKD'97, Tucson Arizona, 1997
7[7]Kukich K. Techniques for automatically correcting words in text. ACM Computing Surveys, 1992, 24(4):377-439
8[8]Wagner R A， Fischer M J. The string-to-string correction problem. J ACM, 1974, 21(1):168-173
9[9]Lowrance R， Robert A Wagner. An extension of the string-to-string correction problem. J ACM, 1975， 22(2):177-183
10[10] Sellers P H. On the theory and computation of evolutionary distances. SIAM J Applied Mathematics, 1974, 26(4):787-793

共引文献79

1缪嘉嘉,吴刚,毛捍东,杨强,邓苏.一种基于条件概率分布的近似重复记录检测方法[J].小型微型计算机系统,2004,25(12):2164-2168. 被引量：3
2孟坚,董逸生,王永利.一种基于规则的交互式数据清洗技术[J].微机发展,2005,15(4):141-144. 被引量：4
3王志军,乐嘉锦.一种中文相似重复记录的检测方法[J].东华大学学报（自然科学版）,2005,31(2):37-40.
4肖国荣.银行零售贷款风险管理系统分析[J].福建电脑,2006,22(7):140-141.
5朱恒民,王宁生.一种改进的相似重复记录检测方法[J].控制与决策,2006,21(7):805-808. 被引量：12
6胡立辉,田跃,盘善荣.公路交通量调查数据处理系统[J].计算机工程,2007,33(22):280-282. 被引量：3
7寇月,申德荣,李冬,聂铁铮.一种基于语义及统计分析的DeepWeb实体识别机制[J].软件学报,2008,19(2):194-208. 被引量：18
8韩京宇,徐立臻,董逸生.数据质量研究综述[J].计算机科学,2008,35(2):1-5. 被引量：102
9刘哲,夏秀峰,宋晓燕,林桐.一种中文地址类相似重复信息的检测方法[J].小型微型计算机系统,2008,29(4):726-729. 被引量：7
10郭小瑛,曾广平.基于Web2．0的数据集成系统的设计与实现[J].微电子学与计算机,2008,25(6):34-37. 被引量：2

同被引文献30

1陈训逊,方滨兴,胡铭曾,李蕾.一个网络信息内容安全的新领域——网络信息渗透检测技术[J].通信学报,2004,25(7):185-191. 被引量：12
2沈昌祥,张焕国,王怀民,王戟,赵波,严飞,余发江,张立强,徐明迪.可信计算的研究与发展[J].中国科学：信息科学,2010,40(2):139-166. 被引量：252
3张焕国,严飞,傅建明,徐明迪,杨飏,何凡,詹静.可信计算平台测评理论与关键技术研究[J].中国科学：信息科学,2010,40(2):167-188. 被引量：13
4张焕国,毋国庆,覃中平,刘玉珍,刘毅,彭涛,韩永桥.一种新型安全计算机[J].武汉大学学报（理学版）,2004,50(A01):1-6. 被引量：21
5张焕国,刘玉珍,余发江,周强,叶新.一种新型嵌入式安全模块[J].武汉大学学报（理学版）,2004,50(A01):7-11. 被引量：7
6苏贵洋,马颖华,李建华.一种基于内容的信息过滤改进模型[J].上海交通大学学报,2004,38(12):2030-2034. 被引量：22
7沈昌祥,张焕国,冯登国,曹珍富,黄继武.信息安全综述[J].中国科学（E辑）,2007,37(2):129-150. 被引量：358
8LU MingXin,LAI XueJia,XIAO GuoZhen,QIN Lei.Symmetric-key cryptosystem with DNA technology[J].Science in China(Series F),2007,50(3):324-333. 被引量：14
9方滨兴,陆天波,李超.软件确保研究进展[J].通信学报,2009,30(2):106-117. 被引量：7
10周德懋,李舟军.高性能网络爬虫:研究综述[J].计算机科学,2009,36(8):26-29. 被引量：91

引证文献2

1ZHANG HuanGuo,HAN WenBao,LAI XueJia,LIN DongDai,MA JianFeng,LI JianHua.Survey on cyberspace security[J].Science China(Information Sciences),2015,58(11):1-43. 被引量：16
2张焕国,韩文报,来学嘉,林东岱,马建峰,李建华.网络空间安全综述[J].中国科学：信息科学,2016,46(2):125-164. 被引量：147

二级引证文献163

1张艳硕,常万里,刘冰.密码应用技术课程5+X教学模式设计[J].北京电子科技学院学报,2020,28(2):53-60. 被引量：8
2毕晟.全球网络空间治理研究现状评析[J].北京电子科技学院学报,2019,0(1):45-54.
3周海平,沈士根,黄龙军,冯晟.基于博弈论的无线传感器网络恶意程序传播模型[J].电信科学,2018,34(11):67-76. 被引量：10
4胡超宇.计算机网络安全问题及防护措施[J].网络安全技术与应用,2019(1):1-1.
5LIU Jinhui,ZHANG Huanguo,JIA Jianwei.Cryptanalysis of Schemes Based on Pseudoinverse Matrix[J].Wuhan University Journal of Natural Sciences,2016,21(3):209-213.
6黄强,常乐,张德华,汪伦伟.基于可信计算基的主机可信安全体系结构研究[J].信息网络安全,2016(7):78-84. 被引量：7
7黄强,孔志印,常乐,张德华.可信基线及其管理机制[J].信息网络安全,2016(9):145-148. 被引量：2
8杜之波,吴震,王敏.针对应用密码算法的攻击实验平台设计[J].丽水学院学报,2016,38(5):82-86. 被引量：1
9王鹃,张焕国.网络空间安全学科人才培养探索与思考[J].信息安全研究,2016,2(11):1049-1052. 被引量：14
10Yonggan Li,Xueguang Zhou,Yan Sun,Huanguo Zhang.Design and Implementation of Weibo Sentiment Analysis Based on LDA and Dependency Parsing[J].China Communications,2016,13(11):91-105. 被引量：4

1曾翠玲,苏大威.公路交通量分析与预测系统的开发[J].江苏交通科技,2001(1):8-9.
2胡立辉,田跃,盘善荣.公路交通量调查数据处理系统[J].计算机工程,2007,33(22):280-282. 被引量：3
3周斌.分布式公路交通量数据服务中心的设计与实现[J].长沙理工大学学报（自然科学版）,2007,4(2):68-71. 被引量：2
4李国强,葛文渊.3G无线网络传输监控系统设计与实践[J].中国交通信息化,2013(3):80-81.
5邱越峰,田增平,季文贇,周傲英.一种高效的检测相似重复记录的方法[J].计算机学报,2001,24(1):69-77. 被引量：72
6贾方伟,杨武,於文雪,余刚刚.基于区间算法理论的数字图像处理[J].电脑知识与技术,2013,9(6):3820-3822. 被引量：2
7田智慧,王世杰.基于四阶段预测理论的公路交通量预测研究[J].郑州大学学报（工学版）,2008,29(3):133-136. 被引量：15
8穆雅莉,杨兵,喻明艳.基于区间模型的一级指令Cache缺失损失分析[J].计算机工程,2012,38(7):273-275.
9韩旭,侯明善,姚成法.基于区间系统的鲁棒H_∞飞行控制系统设计[J].航空兵器,2007,14(3):20-24. 被引量：2
10陈庆庆.台站如何做好自动站报表人机互审[J].陕西气象,2009(6):45-46. 被引量：2

计算机工程

2008年第21期

浏览历史

内容加载中请稍等...

海量数据库中实时包的判重算法被引量：2

参考文献6

二级参考文献18

共引文献79

同被引文献30

引证文献2

二级引证文献163

相关作者

相关机构

相关主题

浏览历史

海量数据库中实时包的判重算法 被引量：2

参考文献6

二级参考文献18

共引文献79

同被引文献30

引证文献2

二级引证文献163

相关作者

相关机构

相关主题

浏览历史

海量数据库中实时包的判重算法被引量：2