期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于经验模态分解的企业等值连接共享数据加密方法
1
作者
姜震
张勇
王莉
《信息技术》
2023年第11期120-125,共6页
为降低网络带来的企业等值连接共享数据泄露风险,研究基于经验模态分解的企业等值连接共享数据加密方法。依据哈希算法完成企业多路数据等值连接共享;使用经验模态分解将共享数据分解成多个IMF分量;通过基于同态加密和密钥共享的企业等...
为降低网络带来的企业等值连接共享数据泄露风险,研究基于经验模态分解的企业等值连接共享数据加密方法。依据哈希算法完成企业多路数据等值连接共享;使用经验模态分解将共享数据分解成多个IMF分量;通过基于同态加密和密钥共享的企业等值连接共享数据加密方法,使用公钥对第二个至最后一个IMF分量进行同态加密;利用私钥将加密结果解密后与第一个IMF分量相加,实现企业等值连接共享数据加密。实验结果表明:等值连接响应时间均在15~25s内,发生恶意攻击时,窃取密钥和正确密钥间的相关系数始终低于0.003。
展开更多
关键词
经验模态分解
企业等值连接
共享数据加密
IMF分量
同态加密
下载PDF
职称材料
Spark上的等值连接优化
被引量:
12
2
作者
卞昊穹
陈跃国
+1 位作者
杜小勇
高彦杰
《华东师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2014年第5期263-270,280,共9页
等值连接作为数据分析中最常用、代价最高的操作之一,在Spark上的实现和优化与传统并行数据库有很大的差别,传统并行数据仓库中基于数据预划分的连接算法在Spark上难以实现,而目前被广泛采用的Broadcast Join和Repartition Join性能较差...
等值连接作为数据分析中最常用、代价最高的操作之一,在Spark上的实现和优化与传统并行数据库有很大的差别,传统并行数据仓库中基于数据预划分的连接算法在Spark上难以实现,而目前被广泛采用的Broadcast Join和Repartition Join性能较差,如何提高连接性能成为基于Spark的海量数据分析的关键.本研究将Simi-Join与Partition Join的优势相结合,并基于Spark上的特性提出了一种优化的等值连接算法.代价分析和实验表明本算法比现有基于Spark的数据分析系统中的连接算法性能提升1~2倍.
展开更多
关键词
大数据分析
等值连接
内存计算
下载PDF
职称材料
等值连接查询语义的理解与表达
3
作者
魏梨君
潘阳
+1 位作者
王浩
张岩
《嘉应学院学报》
2018年第11期9-15,共7页
针对关系数据库在数据关联语义表达上的不足,提出一种基于模式联系图的等值连接关联语义表达方法,以期实现等值连接查询语义的理解与表达.从关系模式的结构出发,对等值连接查询语义进行分解,分析信息关联特征对等值连接查询的决定作用,...
针对关系数据库在数据关联语义表达上的不足,提出一种基于模式联系图的等值连接关联语义表达方法,以期实现等值连接查询语义的理解与表达.从关系模式的结构出发,对等值连接查询语义进行分解,分析信息关联特征对等值连接查询的决定作用,说明信息关联特征与等值连接数据关联的对应关系,给出基于遍历路径的关联语义分析方法及表达形式.研究表明,该方法能够对关系数据库等值连接的关联语义进行分析和表达.该工作对于数据库语义研究、数据查询检索、面向用户的查询检索等具有现实参考意义.
展开更多
关键词
数据关联
数据查询
等值连接
语义分析
遍历路径
下载PDF
职称材料
大数据连接算法分析
4
作者
李立现
屈晓平
高琴琴
《电脑知识与技术》
2015年第5期219-220,229,共3页
大数据主要有四个典型特征:海量、多样性、高速、易变。连接算法优化是大数据热点问题之一,2010年以来,数据库顶级会议ICDE,Sigmod和VLDB每年都有专门的文章研究基于Map Reduce的连接算法优化。依据连接条件主要可以分为等值连接法、...
大数据主要有四个典型特征:海量、多样性、高速、易变。连接算法优化是大数据热点问题之一,2010年以来,数据库顶级会议ICDE,Sigmod和VLDB每年都有专门的文章研究基于Map Reduce的连接算法优化。依据连接条件主要可以分为等值连接法、数据倾斜时连接法和任意连接法,分析三种数据连接方法,介绍三种连接算法设计和优化方式,并针对基于Bloom Filter等值连接设计和优化做了和二阶段法和三阶段法的实验分析。两表等值连接,数据量较大时,采用基于Bloom Filter等值连接方式会在一定范围减少算法执行时间,提高数据连接效率。
展开更多
关键词
云计算
大数据集
等值连接
任意连接
下载PDF
职称材料
面向多属性的不等值连接操作算法
被引量:
1
5
作者
孟庆强
何浩奇
+2 位作者
毕倪飞
赵斌
吉根林
《计算机工程》
CAS
CSCD
北大核心
2019年第6期60-66,共7页
为降低多属性不等值连接操作的计算代价,提出一种基于属性优选的不等值连接操作算法MIEJoin。按照连接属性对元组进行排序,计算各连接属性的候选集大小,在最小候选集中根据连接谓词进行筛选得到最终的结果集。在此基础上,为提升系统的...
为降低多属性不等值连接操作的计算代价,提出一种基于属性优选的不等值连接操作算法MIEJoin。按照连接属性对元组进行排序,计算各连接属性的候选集大小,在最小候选集中根据连接谓词进行筛选得到最终的结果集。在此基础上,为提升系统的缓存命中率,提出一种缓存敏感的多属性不等值连接算法CMIEJoin。基于MIEJoin算法建立元组的排列顺序数组,在内存中邻近存储连续访问的数据,以降低缓存的缺失次数并提升算法的运行效率。在TPC-H数据集上的实验结果表明,与BIEJoin算法和NLJoin算法相比,CMIEJoin算法具有较高的运行效率。
展开更多
关键词
不等值查询
不等值连接
最小候选集
缓存敏感算法
查询处理
下载PDF
职称材料
基于Spark的大数据统计中等值连接问题的优化
6
作者
刘容辰
周明强
+1 位作者
皮兴杰
赵欣
《现代计算机》
2017年第8期3-6,共4页
伴随着互联网应用技术的飞速发展,导致传统的数据处理技术已经无法满足对大数据高效处理的要求。因此对现有的大数据的统计分析便急需相应的大数据技术的支持。为了解决实际Spark应用中的Join操作低效的问题,首先,提出一种高效的基于Blo...
伴随着互联网应用技术的飞速发展,导致传统的数据处理技术已经无法满足对大数据高效处理的要求。因此对现有的大数据的统计分析便急需相应的大数据技术的支持。为了解决实际Spark应用中的Join操作低效的问题,首先,提出一种高效的基于BloomFilter过滤再分区算法,通过该算法率先过滤掉绝大部分不符合条件的无效连接,然后针对过滤数据产生的倾斜问题进行再分区操作,以便能充分发挥各个工作节点的计算资源,达到在最大程序上优化Join过程的目的。
展开更多
关键词
大数据
SPARK
等值连接
BLOOM
FILTER
SHUFFLE
下载PDF
职称材料
一种基于虚拟处理区间划分的负载均衡等值连接算法
7
作者
胡忠奎
屈波
+1 位作者
黄斌
黎文阳
《现代计算机》
2016年第2期3-7,共5页
数据分析和处理是大数据处理中最重要的任务,而等值连接又是数据分析中最常用、代价最高的操作之一。在实际的等值连接操作中,存在一个重要的问题就是数据倾斜:分配到每个任务的数据量不均衡,造成部分任务的完成时间更长,致使连接性能...
数据分析和处理是大数据处理中最重要的任务,而等值连接又是数据分析中最常用、代价最高的操作之一。在实际的等值连接操作中,存在一个重要的问题就是数据倾斜:分配到每个任务的数据量不均衡,造成部分任务的完成时间更长,致使连接性能受到严重影响。为解决这个问题,提出一种负载均衡的等值连接算法(VPRP),通过采样估计数据集在连接属性上的数据分布情况,并采用虚拟分区和交叉映射的方法,在倾斜严重的数据周围划分出更多的区间,以增加数据分配的均衡性,同时消减连接噪声对整体性能的消极影响,最后实验验证该算法的有效性。
展开更多
关键词
等值连接
负载均衡
数据倾斜
范围分割
下载PDF
职称材料
一种基于负载代价的MapReduce等值连接优化算法
8
作者
郑钤
向军
《湖北民族学院学报(自然科学版)》
CAS
2018年第3期342-347,共6页
MapReduce并行计算模型在大规模分布式数据处理中应用广泛,但该模型不能很好地支持连接操作,特别是面对倾斜数据时,原有的分区算法容易造成处理节点间的负载不均衡。针对这一问题,提出一种基于key代价的负载均衡等值连接算法,对Map端中...
MapReduce并行计算模型在大规模分布式数据处理中应用广泛,但该模型不能很好地支持连接操作,特别是面对倾斜数据时,原有的分区算法容易造成处理节点间的负载不均衡。针对这一问题,提出一种基于key代价的负载均衡等值连接算法,对Map端中间结果进行采样,根据采样结果计算每一key值的负载代价,并在此基础上,设计一种动态划分函数,对不同的key值按照负载代价均匀划分到各个计算节点,实现了负载均衡。实验结果表明,在同构集群下,提出的算法在负载均衡方面具有较好的效果.
展开更多
关键词
MAPREDUCE
负载均衡
等值连接
key代价
下载PDF
职称材料
题名
基于经验模态分解的企业等值连接共享数据加密方法
1
作者
姜震
张勇
王莉
机构
合肥电力安装有限公司
出处
《信息技术》
2023年第11期120-125,共6页
文摘
为降低网络带来的企业等值连接共享数据泄露风险,研究基于经验模态分解的企业等值连接共享数据加密方法。依据哈希算法完成企业多路数据等值连接共享;使用经验模态分解将共享数据分解成多个IMF分量;通过基于同态加密和密钥共享的企业等值连接共享数据加密方法,使用公钥对第二个至最后一个IMF分量进行同态加密;利用私钥将加密结果解密后与第一个IMF分量相加,实现企业等值连接共享数据加密。实验结果表明:等值连接响应时间均在15~25s内,发生恶意攻击时,窃取密钥和正确密钥间的相关系数始终低于0.003。
关键词
经验模态分解
企业等值连接
共享数据加密
IMF分量
同态加密
Keywords
empirical mode decomposition
enterprise
equi-join
shared data encryption
IMF component
homomorphic encryption
分类号
TM721 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
Spark上的等值连接优化
被引量:
12
2
作者
卞昊穹
陈跃国
杜小勇
高彦杰
机构
数据工程与知识工程教育部重点实验室(中国人民大学)
中国人民大学信息学院
出处
《华东师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2014年第5期263-270,280,共9页
基金
中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)(10XNI018)
文摘
等值连接作为数据分析中最常用、代价最高的操作之一,在Spark上的实现和优化与传统并行数据库有很大的差别,传统并行数据仓库中基于数据预划分的连接算法在Spark上难以实现,而目前被广泛采用的Broadcast Join和Repartition Join性能较差,如何提高连接性能成为基于Spark的海量数据分析的关键.本研究将Simi-Join与Partition Join的优势相结合,并基于Spark上的特性提出了一种优化的等值连接算法.代价分析和实验表明本算法比现有基于Spark的数据分析系统中的连接算法性能提升1~2倍.
关键词
大数据分析
等值连接
内存计算
Keywords
Spark
SQL
big data analysis
equi-join
in-memory computation
分类号
TP392 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
等值连接查询语义的理解与表达
3
作者
魏梨君
潘阳
王浩
张岩
机构
阜阳师范学院
出处
《嘉应学院学报》
2018年第11期9-15,共7页
基金
阜阳师范学院自然科学研究项目“面向用户的数据查询模式研究与实现(2018FSKJ20)”
“关系数据库数据关联语义研究(2019FSKJ12)”
文摘
针对关系数据库在数据关联语义表达上的不足,提出一种基于模式联系图的等值连接关联语义表达方法,以期实现等值连接查询语义的理解与表达.从关系模式的结构出发,对等值连接查询语义进行分解,分析信息关联特征对等值连接查询的决定作用,说明信息关联特征与等值连接数据关联的对应关系,给出基于遍历路径的关联语义分析方法及表达形式.研究表明,该方法能够对关系数据库等值连接的关联语义进行分析和表达.该工作对于数据库语义研究、数据查询检索、面向用户的查询检索等具有现实参考意义.
关键词
数据关联
数据查询
等值连接
语义分析
遍历路径
Keywords
Data Association
Data Query
equi-join
Semantic Analysis
Traversal Path
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
大数据连接算法分析
4
作者
李立现
屈晓平
高琴琴
机构
九江学院信息科学与技术学院
九江供电公司
出处
《电脑知识与技术》
2015年第5期219-220,229,共3页
基金
江西省教育科学“十二五”规划课题(13YB137)
九江学院校级科研课题(2014KJYB031)
文摘
大数据主要有四个典型特征:海量、多样性、高速、易变。连接算法优化是大数据热点问题之一,2010年以来,数据库顶级会议ICDE,Sigmod和VLDB每年都有专门的文章研究基于Map Reduce的连接算法优化。依据连接条件主要可以分为等值连接法、数据倾斜时连接法和任意连接法,分析三种数据连接方法,介绍三种连接算法设计和优化方式,并针对基于Bloom Filter等值连接设计和优化做了和二阶段法和三阶段法的实验分析。两表等值连接,数据量较大时,采用基于Bloom Filter等值连接方式会在一定范围减少算法执行时间,提高数据连接效率。
关键词
云计算
大数据集
等值连接
任意连接
Keywords
Cloud Computing
Big Data
equi-join
θ Join
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向多属性的不等值连接操作算法
被引量:
1
5
作者
孟庆强
何浩奇
毕倪飞
赵斌
吉根林
机构
南瑞集团有限公司(国网电力科学研究院有限公司)
南京师范大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第6期60-66,共7页
基金
国家自然科学基金(41471371)
文摘
为降低多属性不等值连接操作的计算代价,提出一种基于属性优选的不等值连接操作算法MIEJoin。按照连接属性对元组进行排序,计算各连接属性的候选集大小,在最小候选集中根据连接谓词进行筛选得到最终的结果集。在此基础上,为提升系统的缓存命中率,提出一种缓存敏感的多属性不等值连接算法CMIEJoin。基于MIEJoin算法建立元组的排列顺序数组,在内存中邻近存储连续访问的数据,以降低缓存的缺失次数并提升算法的运行效率。在TPC-H数据集上的实验结果表明,与BIEJoin算法和NLJoin算法相比,CMIEJoin算法具有较高的运行效率。
关键词
不等值查询
不等值连接
最小候选集
缓存敏感算法
查询处理
Keywords
non-equi query
non-equi join
minimal candidate set
cache-sensitive algorithm
query processing
分类号
TP392 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Spark的大数据统计中等值连接问题的优化
6
作者
刘容辰
周明强
皮兴杰
赵欣
机构
重庆大学计算机学院
出处
《现代计算机》
2017年第8期3-6,共4页
文摘
伴随着互联网应用技术的飞速发展,导致传统的数据处理技术已经无法满足对大数据高效处理的要求。因此对现有的大数据的统计分析便急需相应的大数据技术的支持。为了解决实际Spark应用中的Join操作低效的问题,首先,提出一种高效的基于BloomFilter过滤再分区算法,通过该算法率先过滤掉绝大部分不符合条件的无效连接,然后针对过滤数据产生的倾斜问题进行再分区操作,以便能充分发挥各个工作节点的计算资源,达到在最大程序上优化Join过程的目的。
关键词
大数据
SPARK
等值连接
BLOOM
FILTER
SHUFFLE
Keywords
Big Data
Spark
equi-join
BloomFilter
Shuffle
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种基于虚拟处理区间划分的负载均衡等值连接算法
7
作者
胡忠奎
屈波
黄斌
黎文阳
机构
四川大学计算机学院
中国人民解放军
出处
《现代计算机》
2016年第2期3-7,共5页
文摘
数据分析和处理是大数据处理中最重要的任务,而等值连接又是数据分析中最常用、代价最高的操作之一。在实际的等值连接操作中,存在一个重要的问题就是数据倾斜:分配到每个任务的数据量不均衡,造成部分任务的完成时间更长,致使连接性能受到严重影响。为解决这个问题,提出一种负载均衡的等值连接算法(VPRP),通过采样估计数据集在连接属性上的数据分布情况,并采用虚拟分区和交叉映射的方法,在倾斜严重的数据周围划分出更多的区间,以增加数据分配的均衡性,同时消减连接噪声对整体性能的消极影响,最后实验验证该算法的有效性。
关键词
等值连接
负载均衡
数据倾斜
范围分割
Keywords
equi-join
Load Balancing
Data Skew
Range Partition
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种基于负载代价的MapReduce等值连接优化算法
8
作者
郑钤
向军
机构
湖北民族学院信息工程学院
出处
《湖北民族学院学报(自然科学版)》
CAS
2018年第3期342-347,共6页
基金
国家自然科学基金项目(61362012)
文摘
MapReduce并行计算模型在大规模分布式数据处理中应用广泛,但该模型不能很好地支持连接操作,特别是面对倾斜数据时,原有的分区算法容易造成处理节点间的负载不均衡。针对这一问题,提出一种基于key代价的负载均衡等值连接算法,对Map端中间结果进行采样,根据采样结果计算每一key值的负载代价,并在此基础上,设计一种动态划分函数,对不同的key值按照负载代价均匀划分到各个计算节点,实现了负载均衡。实验结果表明,在同构集群下,提出的算法在负载均衡方面具有较好的效果.
关键词
MAPREDUCE
负载均衡
等值连接
key代价
Keywords
MapReduce
load balancing
equi-join
key cost
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于经验模态分解的企业等值连接共享数据加密方法
姜震
张勇
王莉
《信息技术》
2023
0
下载PDF
职称材料
2
Spark上的等值连接优化
卞昊穹
陈跃国
杜小勇
高彦杰
《华东师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2014
12
下载PDF
职称材料
3
等值连接查询语义的理解与表达
魏梨君
潘阳
王浩
张岩
《嘉应学院学报》
2018
0
下载PDF
职称材料
4
大数据连接算法分析
李立现
屈晓平
高琴琴
《电脑知识与技术》
2015
0
下载PDF
职称材料
5
面向多属性的不等值连接操作算法
孟庆强
何浩奇
毕倪飞
赵斌
吉根林
《计算机工程》
CAS
CSCD
北大核心
2019
1
下载PDF
职称材料
6
基于Spark的大数据统计中等值连接问题的优化
刘容辰
周明强
皮兴杰
赵欣
《现代计算机》
2017
0
下载PDF
职称材料
7
一种基于虚拟处理区间划分的负载均衡等值连接算法
胡忠奎
屈波
黄斌
黎文阳
《现代计算机》
2016
0
下载PDF
职称材料
8
一种基于负载代价的MapReduce等值连接优化算法
郑钤
向军
《湖北民族学院学报(自然科学版)》
CAS
2018
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部