基于数据倾斜关联度的数据库高效挖掘方法被引量：2

Database Efficient Mining Method Research Based on the Data Skew Relational

下载PDF

导出

摘要提出一种基于数据倾斜关联度的数据高效算法,首次给出数据倾斜度的概念,利用数据类间特征进行数据倾斜程度的判断,对相似数据进行类间聚类,将数据库中数据特征进行信息相似度计算,计算概念总出现次数时应累加其所有子概念的出现次数。在查询的过程中,充分考虑同一数据属性的多样性,对数据特征加入模型的数量进行约束,减少不必要的繁琐数据特征。判断符合查询条件的数据类别,根据不同的数据类别进行数据查询,实现数据结构的优化。实验结果表明,利用这种算法进行数据库查询优化,能够有效提高海量数据库信息查询的效率。 Presents an efficient algorithm based on data from the data skew incidence degree. First proposed the concept of gradient data, using the data between the characteristics of data skew degree of judgment, of similarity between classes the data clustering, the data in the database information characteristics of similarity calculation, computing concept over-all occurrences should be added when the occurrences of the concept of all children. In the process of query, give full consideration to the diversity of the same data attributes, to join model with constraints on the number of data characteris-tics, reduce unnecessary red tape data characteristics. Conform to the category of data query condition, according to the different categories of data query, optimizing the data structure. The experimental results show that using this algorithm, database query optimization, can effectively improve the efficiency of mass database information query.

作者肖志良

机构地区佛山职业技术学院电子信息系

出处《科技通报》北大核心 2014年第2期53-55,58,共4页 Bulletin of Science and Technology

关键词约束模型匹配约束数据库查询 constraint model matching constraints database query

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1励文杰.大型数据库ORACLE数据库的优化设计方案[J].科技风,2011(19):145-145. 被引量：14
2张述刚,王玲,侯玉晓.浅谈医院数据库备份策略及数据库简单故障修复[J].中国医疗前沿,2009,4(21):114-115. 被引量：8
3韩彤.跟踪和管理并发用户数量提高数据库系统效率[J].信息技术与信息化,2011(5):49-50. 被引量：7
4闾素红,任艳娜.Web方式人脸识别的设计与实现[J].科技通报,2012,28(9):185-188. 被引量：14
5李国正,杨杰,孔安生,陈念贻.基于聚类算法的选择性神经网络集成[J].复旦学报（自然科学版）,2004,43(5):689-691. 被引量：15
6黄显华,赵荣珍.基于数据挖掘的数据库技术在转子故障知识发现中的应用方法研究[J].计算机测量与控制,2011,19(11):2668-2671. 被引量：7

二级参考文献30

1陈穗,智国昌.SQL SERVER数据库故障的定位和修复——从广东汕汾高速公路收费系统一例数据库故障谈起[J].中国交通信息产业,2004(8):126-128. 被引量：1
2伍星,陈进,李如强,陈一鸣.基于数据挖掘的设备状态监测和故障诊断[J].振动与冲击,2004,23(4):70-74. 被引量：22
3孔凡芝,张兴周,谢耀菊.基于Adaboost的人脸检测技术[J].应用科技,2005,32(6):7-9. 被引量：19
4潘鹏,杜旭,叶婷,徐静华.RTP/RTCP实时传输协议的研究与Linux实现[J].计算机工程与应用,2005,41(24):105-107. 被引量：13
5李全凯.HIS系统数据备份策略规划分析[J].医学情报工作,2005,26(5):336-338. 被引量：3
6吴明强,史慧,朱晓华,肖开清.故障诊断专家系统研究的现状与展望[J].计算机测量与控制,2005,13(12):1301-1304. 被引量：67
7章民融,徐亚锋.基于RTSP的流媒体视频服务器的设计与实现[J].计算机应用与软件,2006,23(7):93-95. 被引量：23
8朱长春,李友荣,侯澍旻,肖涵.OLAP技术在齿轮故障特征分析中的运用[J].振动．测试与诊断,2006,26(3):192-195. 被引量：1
9刘锦,刘晓洁,李涛,赵奎,张晓平,陈云峰,孙洁.一种异地容灾系统的设计与实现[J].计算机应用研究,2007,24(8):294-296. 被引量：10
10Klosgen Willi. Problems for Knowledge Discovery in Databases and Their Treatment in the Statistics Interpreter Explore [J]. Interna- tional Journal of Intelligent System, 1992, 7 (7) : 64,9 - 673.

共引文献47

1周和平,方绪涛,康岳一阳,杨芳芳,景智(指导),何玉洁(指导).基于人脸识别的教师考勤系统的设计与实现[J].南国博览,2019(2):3-4.
2欧阳柏成.网络大数据下的冗余数据分类优化算法研究[J].微电子学与计算机,2015,32(1):128-130. 被引量：2
3李国正,李丹.集成学习中特征选择技术[J].上海大学学报（自然科学版）,2007,13(5):598-604. 被引量：7
4缑水平,焦李成,张向荣.基于免疫克隆的核匹配追踪集成图像识别算法[J].模式识别与人工智能,2009,22(1):79-85. 被引量：6
5张宇,尹义龙,骆功庆.基于支持向量机的指纹图像质量分类方法[J].模式识别与人工智能,2009,22(1):129-135. 被引量：4
6刘天羽,张延迟.齿轮故障诊断中的选择性集成技术[J].上海电机学院学报,2009,12(2):118-120. 被引量：1
7齐新战,刘丙杰,冀海燕.基于聚类分析的综合神经网络集成算法[J].计算机仿真,2010,27(1):166-169. 被引量：5
8牛鹏,魏维,李峻金,郭建国.一种分类器选择方法[J].计算机工程,2010,36(14):163-165. 被引量：1
9欧吉顺,朱玉全,陈耿,于海平.基于动态加权的粗糙子空间集成[J].计算机工程,2010,36(22):178-180. 被引量：1
10黄文涛,鲍鸿,张晶.基于模糊聚类的神经网络集成[J].计算机与现代化,2011(3):12-14.

同被引文献16

1王立君.并行多媒体数据库中基于内容的高效检索的数据分配方法的研究[J].科学技术与工程,2013,21(9):2544-2548. 被引量：5
2黄华.基于大云数据快速挖掘过程的研究与仿真[J].计算机仿真,2013,30(4):386-389. 被引量：7
3彭佳琪,肖毅,聂笑一.食品安全数据分析决策系统的设计与实现[J].现代计算机（中旬刊）,2013(9):80-83. 被引量：3
4林瑞,钟诚,华蓓.隐私保护的一站多表跨多表频繁项集挖掘[J].计算机应用,2013,33(12):3437-3440. 被引量：1
5颜一鸣,郭鑫.一种基于Hadoop的动态树增量更新方法[J].计算机工程,2014,40(3):67-70. 被引量：1
6徐志玮,郑建瑜,晏武.社会化标注系统的信息检索关键技术研究综述[J].情报杂志,2014,33(4):148-152. 被引量：3
7陈国良,冯琦峰,周远.移动互联环境下民生档案的智能检索设计[J].中国电子商情（科技创新）,2014(2):50-50. 被引量：1
8陶锐.信息检索中P2P技术的应用研究[J].电子技术与软件工程,2014(6):20-20. 被引量：2
9王爽,潘静.一种基于颜色与纹理特征的图像模糊检索算法[J].电子测量技术,2014,37(2):54-57. 被引量：10
10刘超,李伟.基于本体语义检索技术研究[J].自动化技术与应用,2014,33(2):9-12. 被引量：3

引证文献2

1徐新爱.无人机海量飞行数据快速检索方法研究[J].计算机测量与控制,2014,22(12):4181-4183. 被引量：8
2杨小琴.大型数据库中的并行高效检测方法仿真分析[J].计算机仿真,2016,33(7):392-394. 被引量：2

二级引证文献10

1于强强,茹乐,于云龙,方堃.基于网络编码的无人机数据链技术研究[J].计算机测量与控制,2015,23(7):2563-2565. 被引量：2
2王晓英.海量冗余数据干扰下数据库中数据优化检索方法[J].华侨大学学报（自然科学版）,2016,37(6):758-761. 被引量：7
3戴婧睿,吴奇.飞行员负荷通过飞行数据优化识别仿真[J].计算机仿真,2017,34(8):45-49. 被引量：4
4董博,王雪.关联规则算法的计算效率优化研究[J].计算机仿真,2017,34(9):247-253. 被引量：5
5夏长俊,孙校书,李冰.基于飞行数据的无人机平飞质量分析方法[J].海军航空工程学院学报,2017,32(5):478-482. 被引量：3
6沈一超,倪世宏,张鹏.基于贝叶斯网络的飞行动作识别方法[J].计算机工程与应用,2017,53(24):161-167. 被引量：19
7黄瑜.大型数据库的关联挖掘算法设计[J].现代电子技术,2018,41(20):45-48. 被引量：2
8王乐,黄长强,魏政磊.基于SSA算法的飞行动作规则自动提取[J].计算机工程与应用,2019,55(14):203-208. 被引量：6
9高平,商富凯,刘健.基于大数据的无人机操控特征与安全边界分析方法[J].航空电子技术,2019,50(2):1-5. 被引量：3
10王凤芹,徐廷学,颜廷龙.基于CART决策树算法的飞行动作识别研究[J].舰船电子工程,2021,41(8):51-53. 被引量：8

1孙焘,陈康睿.基于超像素联接权模型的视频分割算法[J].计算机科学,2016,43(2):302-306. 被引量：1
2刘淑鑫,乐嘉锦.基于局部敏感哈希的近邻传播聚类[J].计算机光盘软件与应用,2014,17(6):142-143.
3胡德敏,龚燕.基于谱聚类和扩展朴素贝叶斯的混合推荐算法[J].计算机应用研究,2016,33(12):3709-3712. 被引量：3
4邵雄凯,肖宏年,王蔚,李晶.用PowerBuilder开发生产管理系统中的几项技术[J].微机发展,2001,11(5):9-11.
5叶青,黄炎磊.基于空间曲线逼近算法的三维图像重建[J].科技通报,2013,29(5):134-137. 被引量：3
6陈爱华,高诚辉,何炳蔚.立体视觉中的图像立体匹配方法[J].中国工程机械学报,2014,12(3):194-198. 被引量：11
7肖艳青,刘党辉,孙朋.图像立体匹配研究进展[J].测控技术,2009,28(8):1-5. 被引量：16
8白明,庄严,王伟.双目立体匹配算法的研究与进展[J].控制与决策,2008,23(7):721-729. 被引量：69
9崔萌,耿伯英.基于序列关系的维修资源匹配算法研究[J].舰船电子工程,2016,36(12):121-126.
10徐姗姗,刘应安,徐昇.立体匹配中边界信息的强化算法[J].山东大学学报（工学版）,2012,42(6):43-49.

科技通报

2014年第2期

浏览历史

内容加载中请稍等...

基于数据倾斜关联度的数据库高效挖掘方法被引量：2

参考文献6

二级参考文献30

共引文献47

同被引文献16

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于数据倾斜关联度的数据库高效挖掘方法 被引量：2

参考文献6

二级参考文献30

共引文献47

同被引文献16

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于数据倾斜关联度的数据库高效挖掘方法被引量：2