期刊文献+
共找到95篇文章
< 1 2 5 >
每页显示 20 50 100
Map Reduce计算模型下并行关联规则挖掘算法研究
1
作者 邵全义 郭雯雯 《电脑知识与技术》 2018年第2Z期22-23,29,共3页
随着大数据时代的来临,数据的量呈现出了爆炸式的增长,在数据挖掘技术上面,传统的算法的弊端逐渐暴露。对于数据挖掘来说,其中最为核心就是关联规则的挖掘,大数据下对数据挖掘的要求不断增加,开发分布式以及并行的关联规则挖掘算法已经... 随着大数据时代的来临,数据的量呈现出了爆炸式的增长,在数据挖掘技术上面,传统的算法的弊端逐渐暴露。对于数据挖掘来说,其中最为核心就是关联规则的挖掘,大数据下对数据挖掘的要求不断增加,开发分布式以及并行的关联规则挖掘算法已经逐渐成为当下数据挖掘的重要课题,而Map Reduce就是一种现今较为流行的分布式并行的计算模型,该文就以Map Reduce计算模型进行探讨,对相关的概念进行介绍,并对未来的数据挖掘算法的走向进行展望,希望能够促进关联规则挖掘算法的发展。 展开更多
关键词 数据挖掘 map reduce 关联规则
下载PDF
MR-CLOPE: A Map Reduce based transactional clustering algorithm for DNS query log analysis 被引量:2
2
作者 李晔锋 乐嘉锦 +2 位作者 王梅 张滨 刘良旭 《Journal of Central South University》 SCIE EI CAS CSCD 2015年第9期3485-3494,共10页
DNS(domain name system) query log analysis has been a popular research topic in recent years. CLOPE, the represented transactional clustering algorithm, could be readily used for DNS query log mining. However, the alg... DNS(domain name system) query log analysis has been a popular research topic in recent years. CLOPE, the represented transactional clustering algorithm, could be readily used for DNS query log mining. However, the algorithm is inefficient when processing large scale data. The MR-CLOPE algorithm is proposed, which is an extension and improvement on CLOPE based on Map Reduce. Different from the previous parallel clustering method, a two-stage Map Reduce implementation framework is proposed. Each of the stage is implemented by one kind Map Reduce task. In the first stage, the DNS query logs are divided into multiple splits and the CLOPE algorithm is executed on each split. The second stage usually tends to iterate many times to merge the small clusters into bigger satisfactory ones. In these two stages, a novel partition process is designed to randomly spread out original sub clusters, which will be moved and merged in the map phrase of the second phase according to the defined merge criteria. In such way, the advantage of the original CLOPE algorithm is kept and its disadvantages are dealt with in the proposed framework to achieve more excellent clustering performance. The experiment results show that MR-CLOPE is not only faster but also has better clustering quality on DNS query logs compared with CLOPE. 展开更多
关键词 DNS data mining MR-CLOPE algorithm transactional clustering algorithm map reduce framework
下载PDF
基于Map Reduce的车辆移动云任务调度算法研究 被引量:2
3
作者 赵法强 袁汉凯 +1 位作者 宋泽均 汪小霞 《自动化技术与应用》 2021年第11期89-93,共5页
车辆移动特性导致移动车辆云任务调度可靠性问题愈发复杂化,据此本文基于Map Reduce提出了车辆移动云任务调度算法,引进了混合整数线性规化最优化方法。通过Map Reduce进行车辆移动云任务调度建模,同时设计了最低复杂度调度算法,在减少... 车辆移动特性导致移动车辆云任务调度可靠性问题愈发复杂化,据此本文基于Map Reduce提出了车辆移动云任务调度算法,引进了混合整数线性规化最优化方法。通过Map Reduce进行车辆移动云任务调度建模,同时设计了最低复杂度调度算法,在减少任务执行延迟时间的基础上,保障了任务调度可靠性。以仿真分析验证了车辆移动云任务调度算法性能,结果表明,本文设计的OTS算法(移动云最优任务调度算法)的作业执行时间、调度成功率、吞吐量等相关性能明显较优,即作业执行时间非常少,保证可靠性,任务调度成功率较高,执行与输出传输延迟问题较少;吞吐量较高。 展开更多
关键词 map reduce 车辆移动 云计算 任务调度
下载PDF
基于MapReduce的Web日志挖掘 被引量:15
4
作者 李彬 刘莉莉 《计算机工程与应用》 CSCD 2012年第22期95-98,共4页
针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的Web日志挖掘算法。为进一步验证该算法的高效性,通过搭建Ha... 针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的Web日志挖掘算法。为进一步验证该算法的高效性,通过搭建Hadoop平台,利用该算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,充分利用了集群系统的分布式计算能力处理大量的Web日志文件,可以大大地提高Web数据挖掘的效率。 展开更多
关键词 云计算 map/reduce HADOOP平台 WEB日志挖掘 蚁群算法
下载PDF
基于Map/Reduce的民航高价值旅客发现方法 被引量:5
5
作者 曹卫东 白亮 聂笑盈 《计算机工程与设计》 北大核心 2015年第4期1078-1083,共6页
为解决常旅客计划模型评价指标单一,不能准确识别高价值旅客的问题,提出一种将Map/Reduce并行处理与数据挖掘知识相结合的发现方法。利用Map/Reduce数据处理模型,在Hadoop分布式平台上并行处理海量PNR数据;根据改进的RFD模型,确定客户... 为解决常旅客计划模型评价指标单一,不能准确识别高价值旅客的问题,提出一种将Map/Reduce并行处理与数据挖掘知识相结合的发现方法。利用Map/Reduce数据处理模型,在Hadoop分布式平台上并行处理海量PNR数据;根据改进的RFD模型,确定客户价值指标,利用AHP层次分析法将专家经验值量化为指标权重;利用聚类分析技术识别高价值旅客,采用真实的PNR数据集进行实验。实验结果表明,该方法能够有效识别民航高价值旅客,为航空公司做出有效决策提供有利依据。 展开更多
关键词 map/reduce映射归约 数据挖掘 RFD模型 AHP层次分析法 客户价值
下载PDF
基于Map/Reduce的朴素贝叶斯数据分类算法研究 被引量:12
6
作者 崔良中 郭福亮 宋建新 《海军工程大学学报》 CAS 北大核心 2019年第4期7-10,共4页
针对目前机器学习研究领域中的数据分类问题,选择朴素贝叶斯算法作为研究对象。首先,通过对样本数据特征属性的权重进行加权调整,提高算法处理的准确率;然后,改进朴素贝叶斯算法分类器模型,使其能够利用Map/Reduce并行编程模型,采用多... 针对目前机器学习研究领域中的数据分类问题,选择朴素贝叶斯算法作为研究对象。首先,通过对样本数据特征属性的权重进行加权调整,提高算法处理的准确率;然后,改进朴素贝叶斯算法分类器模型,使其能够利用Map/Reduce并行编程模型,采用多计算资源节点并行处理,进一步提高处理速度。最后,对UCI dataset数据库进行实验验证,结果表明:改进后的算法在海量数据分类处理中具有更好的性能表现。 展开更多
关键词 map/reduce并行编程模型 数据分类算法 贝叶斯算法 海量数据处理
下载PDF
基于Map/Reduce的海量视频图像检索系统设计 被引量:7
7
作者 杨曼 何鹏 +1 位作者 齐怀琴 安井然 《电视技术》 北大核心 2015年第4期33-36,共4页
齐齐哈尔市公安视频监控系统中每天所产生的大量视频数据对视频图像的检索、管理及安全产生了迫切的需求,视频图像的检索存在两个急需解决的问题,一是视频检索的准确度问题,二是检索效率的问题。面对海量的视频数据库,提出了基于Map/Red... 齐齐哈尔市公安视频监控系统中每天所产生的大量视频数据对视频图像的检索、管理及安全产生了迫切的需求,视频图像的检索存在两个急需解决的问题,一是视频检索的准确度问题,二是检索效率的问题。面对海量的视频数据库,提出了基于Map/Reduce分布式计算模型与关键帧算法结合的方法,既提高了检索效率,又提高了检索准确率。 展开更多
关键词 map/reduce 关键帧 视频检索
下载PDF
DMS算法在Map/Reduce任务调度中的应用 被引量:2
8
作者 裴树军 孔德凯 苗辉 《哈尔滨理工大学学报》 CAS 北大核心 2019年第1期71-77,共7页
云环境下传统的任务调度算法整体效率较低,为了提高任务调度的整体效率,在Map/Reduce基础上提出了一种基于处理时间的DMS任务调度算法。首先,对复杂任务进行预处理,将复杂任务转化为DAG图,依据任务依赖关系大小产生最佳拓扑排序,并依据... 云环境下传统的任务调度算法整体效率较低,为了提高任务调度的整体效率,在Map/Reduce基础上提出了一种基于处理时间的DMS任务调度算法。首先,对复杂任务进行预处理,将复杂任务转化为DAG图,依据任务依赖关系大小产生最佳拓扑排序,并依据排序结果将复杂任务交给work节点进行处理;其次,通过将节点处理任务的预测时间与节点处理能力的比值作为子任务在每个节点的处理"时间"进行量化建模,建立任务和处理时间的度量矩阵,依据DMS算法进行处理,从而获得任务分配最佳方案;最后,从任务调度效率与资源使用率的角度将DMS算法与公平调度算法、遗传算法行对比验证。实验结果表明,DMS算法能明显提高任务调度整体效率,充分利用各节点的计算能力提高了Map/Reduce的调度效率。 展开更多
关键词 云计算 map/reduce 任务调度 差值矩阵
下载PDF
Map/Reduce下快速剪枝算法在复杂任务调度中的应用 被引量:1
9
作者 裴树军 宋冬梅 孔德凯 《计算机科学与探索》 CSCD 北大核心 2018年第1期72-81,共10页
云环境下传统任务分配与调度算法对于复杂任务调度的整体效率较低,为了提高Map/Reduce对复杂任务分配调度的整体效率,提出了一种基于任务处理时间的快速剪枝算法。该算法首先将复杂任务按照任务依赖关系大小进行最佳拓扑排序,使任务按... 云环境下传统任务分配与调度算法对于复杂任务调度的整体效率较低,为了提高Map/Reduce对复杂任务分配调度的整体效率,提出了一种基于任务处理时间的快速剪枝算法。该算法首先将复杂任务按照任务依赖关系大小进行最佳拓扑排序,使任务按顺序执行,从而提高调度准确率。然后使用节点处理任务的预测时间与节点处理能力的比值作为子任务在每个节点的处理时间进行量化建模,建立任务和处理时间的度量矩阵,通过采用按阶剪枝方法逐渐缩小任务分配规模,对N个节点处理N个任务的分配问题,进行N-1次操作可获得任务分配的最优解。运用Hadoop平台进行实验验证,从任务调度效率与资源使用率角度将剪枝算法与公平调度算法、遗传算法和GRAPHENE算法进行对比验证。实验结果表明剪枝算法能明显提高任务调度的整体效率,充分利用各节点的计算能力提高Map/Reduce调度效率。 展开更多
关键词 剪枝算法 map/reduce 任务调度 云计算
下载PDF
动态在线Map/Reduce流数据处理模型及作业拓扑管理协议
10
作者 魏晓辉 李翔 +2 位作者 李洪亮 李聪 庄园 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2015年第5期950-955,共6页
针对海量流数据的在线处理需求,提出一种不同于传统Map/Reduce流数据处理的系统模型Flexible workflow.该模型对workflow处理单元进行在线Map/Reduce并行化,实现了SPATE系统;同时为该系统定义一组关于作业的建立、管理和维护的通信规程... 针对海量流数据的在线处理需求,提出一种不同于传统Map/Reduce流数据处理的系统模型Flexible workflow.该模型对workflow处理单元进行在线Map/Reduce并行化,实现了SPATE系统;同时为该系统定义一组关于作业的建立、管理和维护的通信规程,即拓扑管理协议.SPATE系统解决了在线Map/Reduce流数据处理过程中要求实时性及可扩展性的问题.实验验证了拓扑管理协议的有效性,拓扑管理协议能有效管理Flexible workflow流数据处理模型. 展开更多
关键词 流数据处理 FLEXIBLE workflow模型 map/reduce 拓扑管理
下载PDF
基于Map-Reduce并行构架和AE的大数据指纹监控识别算法
11
作者 史乙力 张诚一 《计算机测量与控制》 2015年第3期864-866,共3页
传统的指纹识别监控方法在应用到以海量、在线和增量为特征的大数据环境中时,不能自动高效地进行识别;由此设计了一种基于Map-Reduce并行框架和AE的大数据智能监控指纹识别算法;首先,设计了基于AE和BP神经网络的识别模型,采用AE进行指... 传统的指纹识别监控方法在应用到以海量、在线和增量为特征的大数据环境中时,不能自动高效地进行识别;由此设计了一种基于Map-Reduce并行框架和AE的大数据智能监控指纹识别算法;首先,设计了基于AE和BP神经网络的识别模型,采用AE进行指纹图像自动特征提取,然后提出了一种基于比较差异算法对AE进行参数初始化的训练算法,采用BP神经网络进行具体识别;最后,将识别过程分解为Map函数和Reduce函数;在Map-Reduce并行框架下对FVC2004中的指纹数据库进行实验,实验结果表明了文中方法能自动、高效地进行指纹识别。 展开更多
关键词 指纹识别 自动编码器 受限玻尔兹曼机 智能监控 mapreduce
下载PDF
MapReduce Scheduler by Characterizing Performance Interference
12
作者 Lei Yang Yu Dai Bin Zhang 《China Communications》 SCIE CSCD 2016年第10期253-262,共10页
Recently, virtualization has become more and more important in the cloud computing to support efficient flexible resource provisioning. However, performance interference among virtual machines(VMs) has become a challe... Recently, virtualization has become more and more important in the cloud computing to support efficient flexible resource provisioning. However, performance interference among virtual machines(VMs) has become a challenge which may affect the effectiveness of resource provisioning. In a virtual cluster which runs the Map Reduce applications, the performance interference can also affect the performance of the Map and Reduce tasks and thus cause a performance degradation of the Map Reduce job. Accordingly, this paper presents a Map Reduce scheduling framework to mitigate this performance degradation caused by the performance interference. The framework includes a performance interference prediction module and an interference aware scheduling algorithm. To verify its effectiveness, we have done a set of experiments on a 24-node virtual Map Reduce cluster. The experiments illustrate that the proposed framework can achieve a performance improvement in the virtualized environment compared with other Map Reduce schedulers. 展开更多
关键词 map reduce SCHEDULER performance interference
下载PDF
基于Map/Reduce的外壳片段立方体并行计算方法 被引量:4
13
作者 唐珊珊 朱跃龙 朱凯 《计算机工程与应用》 CSCD 北大核心 2015年第22期124-129,共6页
针对高维、维度分层的大数据集,提出一种基于Map/Reduce框架的并行外壳片段立方体构建算法。算法采用Map/Reduce框架,实现外壳片段立方体的并行构建与查询。构建算法在Map过程中,计算出各个数据分块所有可能的数据单元或层次维编码前缀;... 针对高维、维度分层的大数据集,提出一种基于Map/Reduce框架的并行外壳片段立方体构建算法。算法采用Map/Reduce框架,实现外壳片段立方体的并行构建与查询。构建算法在Map过程中,计算出各个数据分块所有可能的数据单元或层次维编码前缀;在Reduce过程中,聚合计算得到最终的外壳片段和度量索引表。实验证明,并行外壳片段立方体算法一方面结合了Map/Reduce框架的并行性和高扩展性,另一方面结合了外壳片段立方体的压缩策略和倒排索引机制,能够有效避免高维数据物化时数据量的爆炸式增长,提供快速构建和查询操作。 展开更多
关键词 联机分析处理 外壳片段立方体 map/reduce技术 并行计算
下载PDF
基于Map/Reduce的网页消重并行算法 被引量:2
14
作者 张元丰 董守斌 +1 位作者 张凌 陈晓志 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期153-156,共4页
网页消重模块是搜索引擎系统的重要组成部分,其作用是对搜索引擎的爬虫系统下载的网页进行过滤,去除重复内容的网页,从而提高搜索引擎爬虫系统的性能和检索的质量。提出了一种网页消重的并行算法以及基于Map/Reduce的实现机制,并通过实... 网页消重模块是搜索引擎系统的重要组成部分,其作用是对搜索引擎的爬虫系统下载的网页进行过滤,去除重复内容的网页,从而提高搜索引擎爬虫系统的性能和检索的质量。提出了一种网页消重的并行算法以及基于Map/Reduce的实现机制,并通过实际网站的实验验证了该消重算法的稳定性和处理大量网页时的并行性能。 展开更多
关键词 搜索引擎 网页消重 map/reduce
下载PDF
基于Map/Reduce的索引数据云存储模型研究 被引量:8
15
作者 陆小丽 何加铭 《宁波大学学报(理工版)》 CAS 2011年第3期29-33,共5页
针对目前搜索引擎引擎系统存在的数据量庞大、访问用户高并发性和搜索延迟性的特点,提出了基于云存储的文档索引分类存储模型,并在索引数据分类存储算法实现过程中,采用基于Map/Reduce编程模型的二次索引词权重计算,以降低分类过程中的... 针对目前搜索引擎引擎系统存在的数据量庞大、访问用户高并发性和搜索延迟性的特点,提出了基于云存储的文档索引分类存储模型,并在索引数据分类存储算法实现过程中,采用基于Map/Reduce编程模型的二次索引词权重计算,以降低分类过程中的模糊粒度.通过实验验证基于该存储模型的算法不仅可以提高海量数据索引库的数据处理效率,而且在一定程度上降低了检索系统查询延迟,提高了搜索效率. 展开更多
关键词 搜索引擎 权重 map/reduce 索引
下载PDF
基于改进的Map/Reduce及模式空间划分的数据挖掘 被引量:4
16
作者 刘骞 陈明 《微电子学与计算机》 CSCD 北大核心 2011年第8期140-142,共3页
为通过Map/Reduce基于键/值对以处理数据集与模式集的多对多的对应关系的方式实现数据挖掘,解决在较复杂的类型的模式的挖掘中存在的由组合爆炸导致的模式集过大的问题,提出了通过模式空间划分实现将处理数据集与模式集的对应关系的问... 为通过Map/Reduce基于键/值对以处理数据集与模式集的多对多的对应关系的方式实现数据挖掘,解决在较复杂的类型的模式的挖掘中存在的由组合爆炸导致的模式集过大的问题,提出了通过模式空间划分实现将处理数据集与模式集的对应关系的问题转化为处理数据集与子模式集的集合的对应关系的问题的方法,并对Map/Reduce集群的调度机制及组织、处理键/值对的方式进行了改进,增强了Map/Reduce执行模式挖掘任务的能力.在Map/Reduce集群上采用该思路实现某些较复杂类型的模式的挖掘算法时的并行度高于Map/Reduce化的传统算法. 展开更多
关键词 改进的map/reduce 集群 多对多映射 模式空间划分 模式编码 数据挖掘
下载PDF
基于Map/Reduce的决策树分类挖掘方法应用研究 被引量:4
17
作者 李根 樊龙 +1 位作者 万定生 余宇峰 《计算机与数字工程》 2016年第8期1504-1510,共7页
传统数据挖掘模式在处理海量、多维、复杂等特征的数据时,存在计算能力弱、效率低、可扩展性差等问题。论文提出基于Map/Reduce的决策树分类挖掘方法(C4.5BH算法),该算法采用K-means聚类方法对连续属性进行离散化,并利用Map/Reduce编程... 传统数据挖掘模式在处理海量、多维、复杂等特征的数据时,存在计算能力弱、效率低、可扩展性差等问题。论文提出基于Map/Reduce的决策树分类挖掘方法(C4.5BH算法),该算法采用K-means聚类方法对连续属性进行离散化,并利用Map/Reduce编程模型和属性表结构实现了决策树构造过程中属性的并行计算和节点的并行分裂。实验证明,与传统的C4.5算法相比,C4.5BH算法在处理大规模数据集时具有更高的执行效率和良好的加速比。 展开更多
关键词 map/reduce技术 K-MEANS算法 决策树 C4.5BH算法
下载PDF
基于Map/Reduce的电力监控系统规则挖掘技术研究 被引量:5
18
作者 刘雨欣 张琼洁 张景景 《控制工程》 CSCD 北大核心 2017年第10期2156-2160,共5页
鉴于电力监控系统的多异类信源和动态融合特性,对系统海量实时监控信息进行故障规则挖掘和预测性监测。针对传统决策树法效率难提升问题,提出一种基于并行框架Map/Reduce和包含度测量相融合的规则挖掘算法(MRDT)。通过构建云计算Hadoop... 鉴于电力监控系统的多异类信源和动态融合特性,对系统海量实时监控信息进行故障规则挖掘和预测性监测。针对传统决策树法效率难提升问题,提出一种基于并行框架Map/Reduce和包含度测量相融合的规则挖掘算法(MRDT)。通过构建云计算Hadoop平台,在其分布式并行计算框架Map/Reduce基础上实现基于包含度的决策树规则挖掘算法的并行处理,高效地提取信任度较高的故障规则。以某水电站实时监控系统的电气信息为例,对MRDT算法进行实验测试,结果表明:MRDT算法在保证传统DT算法规则信任度较高的同时,提高了挖掘效率。 展开更多
关键词 电力监控系统 规则挖掘 预测 map/reduce MRDT 信任度
下载PDF
基于Map/Reduce集群上的模式空间划分的序列模式挖掘 被引量:1
19
作者 刘骞 陈明 《微电子学与计算机》 CSCD 北大核心 2012年第9期149-151,156,共4页
通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1-序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一... 通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1-序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一Map节点的瓶颈问题.通过三轮的Map/Reduce任务,实现了模式空间和过滤规则的建立,并在此基础上实现了各子模式空间上独立地进行序列模式的挖掘.通过充分利用整个模式空间的全局特征及各子模式空间的个性特征,设计了优化的非递归挖掘算法,减少了前缀投影库构造次数及对构造的投影库的扫描次数,从而提高了挖掘阶段的效率. 展开更多
关键词 map/reduce模式空间划分 序列模式挖掘 云计算
下载PDF
基于MAP/REDUCE的移动目标连续轨迹模式挖掘的研究 被引量:1
20
作者 彭茗菁 马传香 李伟亮 《物联网技术》 2014年第10期59-60,63,共3页
针对传统序列模式挖掘算法都是针对单机环境、静态实例以及非连续轨迹的不足,提出了Map/Reduce系统与经过优化的PrefixSpan序列模式挖掘算法相结合的改进型算法。该算法在生成投影数据库时,只有当待投影序列的第一个元素和前缀的最后一... 针对传统序列模式挖掘算法都是针对单机环境、静态实例以及非连续轨迹的不足,提出了Map/Reduce系统与经过优化的PrefixSpan序列模式挖掘算法相结合的改进型算法。该算法在生成投影数据库时,只有当待投影序列的第一个元素和前缀的最后一个元素相同时才会被选中,保证了挖掘出的都是连续轨迹片段。同时采用并行处理的方法,使用Map函数构建每个频繁序列前缀对应的投影数据库,使用Reduce函数整合所有的中间键值对得到需要的结果。 展开更多
关键词 map/reduce模型 改进型PrefixSpan算法 轨迹模式 数据挖掘
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部