期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

一种关联感知的大数据导入方法被引量：2

An associated perception import method for big data

下载PDF

导出

摘要针对现有数据库向大数据迁移的背景,Apache推出了Sqoop作为关系数据库向大数据迁移的主要工具。Sqoop简单地将数据表切分并随机存储到不同的节点上。针对Hadoop的这种存储方式带来的关系查询的低效率问题,设计了一种关联度感知的数据导入预处理方法。将关联度较高的表尽量存储在相邻的虚拟机节点,以降低关联数据查询带来的网络传输时延,提高系统的性能。对比实验表明,将关联性较强的数据表存放在相同或相邻节点上,可以成倍提高数据查询的性能。 Against the background of the existing database to the large data migration, Apache introduced the Sqoop as the main tool for the relational database to the big data migration. Sqoop simply cut the data table and randomly store it on diffe rent nodes. Being aimed at the problem of low efficiency of the query of the relationship between the Hadoop, a method of data importing and preprocessing was designed. To reduce the network transmission delay and improve the performance of the system, the high correlation degree was kept in the adjacent nodes. The contrast experiment shows that the performance of the data query can be improved greatly by the same or adjacent nodes.

作者公怀予徐劲松王攀

机构地区中国电信股份有限公司济源分公司南京邮电大学

出处《电信科学》北大核心 2016年第3期130-134,共5页 Telecommunications Science

基金江苏省自然科学基金资助项目(No.BK2009426) 江苏省高校自然科学基金资助项目(No.14KJD520005) 2013江苏省六大人才高峰计划基金资助项目 2013国家发展和改革委员会信息安全专项基金资助项目国家电网公司2014年科技项目:电力信息通信网络流量预测和管理智能化关键技术研究及其应用 2015江苏省产学研前瞻性联合研究项目(No.BY2015011-02)~~

关键词大数据 Sqoop HADOOP NOSQL big data Sqoop Hadoop NoSQL

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献15

1陈吉荣,乐嘉锦.基于MapReduce的Hadoop大表导入编程模型[J].计算机应用,2013,33(9):2486-2489. 被引量：13
2王杰,何明祥,陈海燕.主动实时数据库在数字矿山中的应用[J].中国科技信息,2014(9):175-177. 被引量：3
3张惠民,胡海荣,向阳霞.云平台下的装备保障管理系统结构化数据查询[J].计算机系统应用,2015,24(2):70-74. 被引量：2
4曾志浩,姚贝,张琼林,孙琪.基于Hadoop平台的用户行为挖掘[J].计算技术与自动化,2015,34(2):100-103. 被引量：6
5茅郭胤.电网监控中的主动实时数据库理论和技术探讨[J].通讯世界（下半月）,2015(12):98-99. 被引量：3
6于金良,朱志祥,梁小江.一种基于Sqoop的数据交换系统[J].物联网技术,2016,6(3):35-37. 被引量：18
7刘晨,焦合军.基于HADOOP集群的数据采集和清洗[J].软件工程,2016,19(11):20-24. 被引量：2
8孙浩,李猷.主动实时数据库技术在电网监测中的应用[J].信息系统工程,2017,30(4):89-89. 被引量：2
9刘洋,李筱楠,刘会杰.基于Hadoop的煤炭企业数据共享系统设计[J].煤炭技术,2017,36(6):326-328. 被引量：3
10蒙杰,杨生举,赵昕晖,赵凡.基于Hadoop的海量科技信息资源管理系统设计与实现[J].科技管理研究,2017,37(13):181-186. 被引量：18

引证文献2

1杨彬.Sqoop数据收集与入库系统的应用[J].电子制作,2017,25(21):38-39. 被引量：5
2姜昱辰,韩晓云,汪明贵.主动实时数据库技术在电网状态监测中的应用[J].微型电脑应用,2021,37(8):127-129. 被引量：2

二级引证文献7

1王建军,张英成,战非,赵侃.基于Sqoop的高校海量结构化数据导入研究[J].无线互联科技,2018,15(20):52-53. 被引量：5
2李宝树,张凤佳,沈杨杨.面向电网的边缘算力优化与分布式数据存储处理模型研究[J].广东电力,2020,33(9):92-99. 被引量：12
3吴军,张琳.数据库SQL语言中的难点讨论[J].信息与电脑,2021,33(18):53-55. 被引量：2
4聂文芳,石建华.基于海量数据的学生行为分析平台设计与应用[J].信息与电脑,2022,34(3):162-164. 被引量：4
5杨佳鹏,俎毓伟,纪佳琪,陈丽芳.基于Spark框架的瀑布型融合旅游推荐系统[J].智能计算机与应用,2023,13(4):142-146.
6崔梦璐.电网运行状态监测与预警系统[J].通信电源技术,2023,40(19):84-86.
7陈玉林,陈晓玲,张铮.用Sqoop实现异构环境的数据交换[J].数码世界,2019,0(10):82-82.

1李翠平.EXT JS动态加载机制的研究与实现[J].计算机时代,2017(1):41-42.
2慕灿.复杂结构UG NX模型导入ANSYS Workbench的方法研究[J].四川理工学院学报（自然科学版）,2013,26(4):44-46. 被引量：5
3戴仁俊,陈兴瑞.Flash在虚拟实验开发中的实现技术[J].软件导刊.教育技术,2008,7(9):80-82. 被引量：4
4傅篱.浅议“计算机基础”课程教学中的导入[J].大学教育科学,2003(1):52-53. 被引量：3
5张娟娟.浅谈信息技术课的课堂导入[J].新课程,2015,0(13):150-150.
6刘芳,高兴.计算机教学中导入方法的研究[J].电子世界,2013(11):158-159.
7陈海珍,姚进,成善宝.在Oracle9i环境中实现数据的动态智能导入[J].中国测试技术,2004,30(6):85-86.
8李晓林,刘波涛.配送中心储位动态管理模型研究[J].软件导刊,2007,6(1):51-53. 被引量：5
9张伟,马秀峰.屏幕图形随机存储内存驻留C语言程序的实现[J].微型机与应用,1997,16(8):45-47.
10张玲玲.大学英语教学中的导入方法探析[J].科技信息,2010(3). 被引量：1

电信科学

2016年第3期

相关作者

相关机构

相关主题

;

使用帮助返回顶部