分布式数据库用户丢失数据恢复重构仿真被引量：4

Simulation of User Lost Data Recovery and Reconstruction in Distributed Database

下载PDF

导出

摘要对分布式数据库的用户丢失数据的恢复,能够有效提高数据库数据完整性以及用户信息安全性。对分布式数据库用户丢失数据的恢复重构,需要计算最近邻居的加权系数,获得用户丢失数据的填充值,完成用户丢失数据的恢复重构。传统方法建立用户数据缺失项的取样矩阵,作为压缩感知框架的测量矩阵,但忽略了用户丢失数据的填充值的求取,导致数据恢复效果不理想。提出采用遗传优化方法估计用户丢失数据的参数,获得最优数据参数,在最优参数的基础上,通过基因之间的马氏距离来选取最近邻居基因,将已获得的用户丢失数据缺失参数估计值应用至后续用户丢失数据恢复重构过程中,采用熵值的思想计算最近邻居的加权系数,获得分布式数据库用户丢失数据的填充值。实验结果表明,该方法对于不同缺失模式下的数据,在恢复精度上优于其它的数据恢复方法,在规模较大的数据集上,数据恢复重构性能能够进一步得到提升。 Traditional data recovery methods often ignore the solution of padding value of user data, which results in the unsatisfactory data recovery. In order to get the optimal data parameter, a genetic optimization method was used to estimate the parameters of user missing data. On the basis of optimal parameters, Mahalanobis distance between genes was used to select the nearest neighbor gene. Then, the estimated value of missing parameter of user missing data were applied to subsequent restoration and reconstruction of user missing data. The thought of entropy value was used to calculate the weight coefficient of nearest neighbor. Thus, the padding value of user missing data in distributed database was obtained. Simulation proves that, for data in different deletion models, the proposed method is superior to other data recovery modes on recovery accuracy. In large - scale data set, the reconstruction performance of data can be further improved.

作者何丹丹王立娟 HE Dan - dan;WANG Li - juan(Dalian Institute of Science and Technology, Dalian Liaoning 116052, China)

机构地区大连科技学院

出处《计算机仿真》北大核心 2018年第6期375-379,共5页 Computer Simulation

基金辽宁省民办教育学会2017年科研立项课题(LMJK2017075)

关键词数据库用户丢失数据恢复重构 Database user Missing data Restoration and reconstruction

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1季岚.基于3D纹理渲染的平面景观优化重构方法[J].科技通报,2016,32(3):84-86. 被引量：4
2刘丽娜,马世伟,温加睿.基于局部约束字典学习的数据降维和重构方法[J].仪器仪表学报,2016,37(1):99-108. 被引量：6
3程涛.基于分块对角矩阵的二维压缩感知数据采集和重构方法[J].探测与控制学报,2017,39(3):60-65. 被引量：1
4马俊涛,高梅国,董健.基于稀疏迭代协方差估计的缺失数据谱分析及时域重建方法[J].电子与信息学报,2016,38(6):1431-1437. 被引量：24
5余路,曲建岭,高峰,田沿平,申江江.基于过完备字典的缺失振动数据压缩感知重构算法[J].系统工程与电子技术,2017,39(8):1871-1877. 被引量：10
6郝胜轩,宋宏,周晓锋.一种基于双聚类的缺失数据填补方法[J].计算机应用研究,2015,32(3):674-678. 被引量：12
7彭远浩,潘久辉.基于日志分析的增量数据捕获方法研究[J].计算机工程,2015,41(6):56-60. 被引量：11
8白晋国,孙红胜,胡泽明.一种基于SQLite3文件格式的删除数据恢复方法[J].小型微型计算机系统,2016,37(3):505-509. 被引量：10
9徐程,曲昭伟,陶鹏飞,金盛.动态交通数据异常值的实时筛选与恢复方法[J].哈尔滨工程大学学报,2016,37(2):211-217. 被引量：22
10刘昆.大型数据库中信息资源利用率优化管理仿真[J].计算机仿真,2017,34(7):441-444. 被引量：1

二级参考文献95

1郑术蓉,史宁中,郭建华.含缺失数据线性模型的线性不等式约束EM算法[J].中国科学（A辑）,2005,35(2):231-240. 被引量：12
2王成,胡卫东,杜小勇,郁文贤.稀疏子带的多频段雷达信号融合超分辨距离成像[J].电子学报,2006,34(6):985-990. 被引量：14
3张晓刚,潘久辉.MS SQL Server 2000日志分析方法的研究与实现[J].计算机工程与设计,2006,27(19):3557-3560. 被引量：5
4GARCIALAENCINA P J,SANCHOGOMEZ J L, FIGUEIRASVIDAL A R. Pattern classification with missing data a review [ J ]. Neural Computing and Applications,2010,19 (2) :263- 282.
5LIU Hua-wen,ZHANG Shi-chao. Noisy data elimination using mutual K-nearest neighbor for classification mining [ J ]. The Journal of Sys- tems and Software ,2012,85(5 ) : 1067-1074.
6SYMEONIDIS P, NANOPOULOS A, PAPADOPOULOS A. Nearest biclusters collaborative fihering with constant values [ C ]//Advances in Web Mining and Web Usage Analysis. Berlin : Springer, 2007 : 36- 55.
7PONTES B, DIVINA F,GIRALDEZ R. Virtual error: a new measure for evolutionary biclustering[ C ]//Evolutionary Computation, Machine Learning and Data Mining in Bioinformatics. Berlin: Springer,2007 : 217-226.
8De CASTRO P A D, De FABRICIO F O,FERREIRA H M. Query ex- pansion using an immune-inspired biclustefing algorithm[ J ]. Natural Computing ,2010,9 ( 3 ) : 579 - 602.
9De CASTRO P A D,De FABRICIO F O,FERREIRA H M. Applying biclustering to perform collaborative filtering [ C ]//Proc of the 7th In- ternational Conference on Intelligent Systems Design and Applica- tions. 2007:421-426.
10De FRANCA F O,Von ZUBEN F J. Finding a high coverage set of d- biclusters with swarm intelligence [ C ]//Proc of IEEE Congress on Evolutionary Computation. 2010:2523-2530.

共引文献88

1马利君,熊鸣,吴晔,罗丹,宋寅.基于大数据的工业泵数据分析模式的研究[J].数字制造科学,2021(1):66-70.
2王建军,李冬怡,王赛,李鹏,刘明雨.基于EWM-TOPSIS的城市卡口地点车速数据诊断[J].长安大学学报（自然科学版）,2023,43(3):67-75. 被引量：2
3黄春华.光纤网络中的安全等级预测算法研究[J].激光杂志,2019,40(1):150-154. 被引量：2
4胡文海.分布式数据库分片关系变换自适应查询技术研究[J].自动化与仪器仪表,2019(2):8-11. 被引量：2
5伊卫国,冯向营.不完备数据集的关联分析填补方法及应用[J].大连交通大学学报,2015,36(6):99-101. 被引量：1
6张春生,图雅,翁慧,李艳,魏国利.基于关联规则的条件函数依赖发现及数据修复[J].计算机应用研究,2016,33(2):384-387. 被引量：5
7毛玫静,鄂旭,谭艳,杨明婧.基于属性相关度的缺失数据填补算法研究[J].计算机工程与应用,2016,52(6):74-79. 被引量：9
8戚斌.基于Hadoop的电子通信数据快速存储系统设计[J].电子技术与软件工程,2016(17):179-179.
9刘二侠.紧身针织服对田径运动员下肢肌肉活动的影响[J].西安工程大学学报,2016,30(4):427-432. 被引量：4
10李岗岗,赵婷婷.纺织科技英语强化训练的词汇分类方法[J].西安工程大学学报,2016,30(4):440-445. 被引量：1

同被引文献41

1万勇.数据库在分布式管理系统中的应用[J].电子技术与软件工程,2017(1):167-167. 被引量：2
2刘晓彤.基于DCS的无线传感器网络数据压缩算法研究[J].无线电通信技术,2017,43(1):23-26. 被引量：3
3朱吉昌,邹长春.测井数据小波变换边界效应研究[J].工程地球物理学报,2017,14(1):105-110. 被引量：6
4袁圃,毛剑琳,向凤红,刘恋,张茂兴.改进的基于遗传优化BP神经网络的电网故障诊断[J].电力系统及其自动化学报,2017,29(1):118-122. 被引量：57
5程银波,司菁菁,候肖兰.适用于无线传感器网络的层次化分布式压缩感知[J].电子与信息学报,2017,39(3):539-545. 被引量：8
6王佩玮.无线射频识别标签防碰撞算法比较分析[J].物联网技术,2017,7(4):21-24. 被引量：4
7翁晨涛,崔卫军,廉伟,张元卿,何瑞,柯志强.参数机制方法在工程型号中的实际运用[J].民用飞机设计与研究,2017(1):88-94. 被引量：1
8薛禹胜,陈宁,王树民,文福拴,林振智,汪震.关于利用空间相关性预测风速的评述[J].电力系统自动化,2017,41(10):161-169. 被引量：51
9蒋从元,杨杰.基于分布式多跳误差估计目标位置感知算法[J].电子技术应用,2017,43(11):95-98. 被引量：3
10焦冬冬,张晨,房志奇,康卫.基于云技术的分布式实时数据库系统的设计与实现[J].电子技术应用,2017,43(11):112-115. 被引量：12

引证文献4

1薛小燕,任宏德.基于全局目录的集中型数据库分布式加锁仿真[J].计算机仿真,2020,37(4):414-418. 被引量：2
2万川梅,朱参世,唐宏.基于物联网的分布式通信数据高效压缩仿真[J].计算机仿真,2020,37(6):410-415. 被引量：3
3赵春霞,赵营颖.基于多元回归KNN的网络数据库不完整信息填充[J].计算机仿真,2021,38(8):339-343. 被引量：7
4薛小燕,赵生光,程刚,刘宏伟.基于遗传优化的数据库丢失数据恢复重构仿真[J].计算机仿真,2021,38(11):485-489. 被引量：3

二级引证文献15

1万川梅.基于机器视觉的柑橘病害智能识别关键技术的研究[J].进展,2021(21):89-90.
2李秀丽,胡会南.面向物联网大数据的处理技术研究[J].通信电源技术,2022,39(2):98-100.
3刘铠诚,郭睿,刘容川,乔洪磊.基于多元回归模型的钙质土固结特性优化模型[J].科技与创新,2022(16):67-70. 被引量：2
4缪燕,王和平.基于访问一体化算法的分布式实时数据库研究[J].电子设计工程,2022,30(21):127-130.
5陈旭辉,刘洋,徐娟,孔小怡.基于FTP协议的多源分布式下载技术研究与应用[J].电子设计工程,2023,31(7):42-46. 被引量：1
6张坤,肖慧,徐哈宁,胡佳超,范凌峰.基于主成分分析和长短期记忆网络的滑坡地表位移监测数据缺失插补算法[J].科学技术与工程,2023,23(26):11129-11135. 被引量：2
7蔡榕,杨雪,田江,赵奇,王毅.基于相关性分析和生成对抗网络的电网缺失数据填补方法[J].电力工程技术,2024,43(1):229-237. 被引量：2
8马雁波.铁路通信数据HBase分布式查询系统设计[J].电子设计工程,2024,32(5):156-159.
9胡志强,叶远誉,俞林刚,伍栋文,胡涛.主动负荷参与的低压台区三相负荷不平衡自动均衡方法[J].中国电力,2024,57(2):49-54. 被引量：1
10赵赶超,雷晶晶,刘志强,张林.基于Apriori算法的飞机冲偏出跑道诱因挖掘[J].计算机仿真,2024,41(2):44-50.

1孟祥鹏.大数据网络恶意入侵数据准确恢复仿真研究[J].计算机仿真,2017,34(12):279-282. 被引量：6
2彭文静,单晓华.基于文化生态的旅游经济嵌入路径研究——以崖州文化为例[J].经济研究导刊,2018(14):93-94. 被引量：2
3王慧娟,王勇.分布式数据库用户兴趣信息优化检索仿真[J].计算机仿真,2018,35(6):422-425. 被引量：1
4姚文荣,徐田镇,张海波.涡扇发动机气路传感器故障诊断[J].航空发动机,2017,43(5):54-61.
5周磊,丁玉平.猪繁殖与呼吸综合征病毒类NADC30毒株的新近流行[J].中国猪业,2017,12(11):20-23. 被引量：7
6吴昊,陈立全,沙晶,乔志,吴中奇.一种基于特征匹配定位的SQLite数据恢复方法[J].南京邮电大学学报（自然科学版）,2018,38(1):106-112. 被引量：5
7邹水龙.物联网用户目标节点入侵实时定位仿真[J].计算机仿真,2018,35(3):449-453. 被引量：1
8郑奇斌,刁兴春,曹建军.结合缺失模式的不完整数据模糊聚类[J].计算机科学,2017,44(12):58-63. 被引量：4
9艾小忱,郑广勇,张寿凤,曾浩.基于Cruise-Isight联合仿真的乘用车变速器速比优化[J].机械传动,2018,42(2):90-94. 被引量：4
10许华杰,何敬禄,胡小明.基于块稀疏度估计的压缩感知自适应重构算法[J].计算机应用研究,2018,35(1):305-308. 被引量：4

计算机仿真

2018年第6期

浏览历史

内容加载中请稍等...

分布式数据库用户丢失数据恢复重构仿真被引量：4

参考文献10

二级参考文献95

共引文献88

同被引文献41

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

分布式数据库用户丢失数据恢复重构仿真 被引量：4

参考文献10

二级参考文献95

共引文献88

同被引文献41

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

分布式数据库用户丢失数据恢复重构仿真被引量：4