期刊文献+
共找到122,937篇文章
< 1 2 250 >
每页显示 20 50 100
基于Map/Reduce的民航高价值旅客发现方法 被引量:5
1
作者 曹卫东 白亮 聂笑盈 《计算机工程与设计》 北大核心 2015年第4期1078-1083,共6页
为解决常旅客计划模型评价指标单一,不能准确识别高价值旅客的问题,提出一种将Map/Reduce并行处理与数据挖掘知识相结合的发现方法。利用Map/Reduce数据处理模型,在Hadoop分布式平台上并行处理海量PNR数据;根据改进的RFD模型,确定客户... 为解决常旅客计划模型评价指标单一,不能准确识别高价值旅客的问题,提出一种将Map/Reduce并行处理与数据挖掘知识相结合的发现方法。利用Map/Reduce数据处理模型,在Hadoop分布式平台上并行处理海量PNR数据;根据改进的RFD模型,确定客户价值指标,利用AHP层次分析法将专家经验值量化为指标权重;利用聚类分析技术识别高价值旅客,采用真实的PNR数据集进行实验。实验结果表明,该方法能够有效识别民航高价值旅客,为航空公司做出有效决策提供有利依据。 展开更多
关键词 map/reduce映射归约 数据挖掘 RFD模型 AHP层次分析法 客户价值
下载PDF
基于Map/Reduce的朴素贝叶斯数据分类算法研究 被引量:12
2
作者 崔良中 郭福亮 宋建新 《海军工程大学学报》 CAS 北大核心 2019年第4期7-10,共4页
针对目前机器学习研究领域中的数据分类问题,选择朴素贝叶斯算法作为研究对象。首先,通过对样本数据特征属性的权重进行加权调整,提高算法处理的准确率;然后,改进朴素贝叶斯算法分类器模型,使其能够利用Map/Reduce并行编程模型,采用多... 针对目前机器学习研究领域中的数据分类问题,选择朴素贝叶斯算法作为研究对象。首先,通过对样本数据特征属性的权重进行加权调整,提高算法处理的准确率;然后,改进朴素贝叶斯算法分类器模型,使其能够利用Map/Reduce并行编程模型,采用多计算资源节点并行处理,进一步提高处理速度。最后,对UCI dataset数据库进行实验验证,结果表明:改进后的算法在海量数据分类处理中具有更好的性能表现。 展开更多
关键词 map/reduce并行编程模型 数据分类算法 贝叶斯算法 海量数据处理
下载PDF
基于Map/Reduce的海量视频图像检索系统设计 被引量:7
3
作者 杨曼 何鹏 +1 位作者 齐怀琴 安井然 《电视技术》 北大核心 2015年第4期33-36,共4页
齐齐哈尔市公安视频监控系统中每天所产生的大量视频数据对视频图像的检索、管理及安全产生了迫切的需求,视频图像的检索存在两个急需解决的问题,一是视频检索的准确度问题,二是检索效率的问题。面对海量的视频数据库,提出了基于Map/Red... 齐齐哈尔市公安视频监控系统中每天所产生的大量视频数据对视频图像的检索、管理及安全产生了迫切的需求,视频图像的检索存在两个急需解决的问题,一是视频检索的准确度问题,二是检索效率的问题。面对海量的视频数据库,提出了基于Map/Reduce分布式计算模型与关键帧算法结合的方法,既提高了检索效率,又提高了检索准确率。 展开更多
关键词 map/reduce 关键帧 视频检索
下载PDF
DMS算法在Map/Reduce任务调度中的应用 被引量:2
4
作者 裴树军 孔德凯 苗辉 《哈尔滨理工大学学报》 CAS 北大核心 2019年第1期71-77,共7页
云环境下传统的任务调度算法整体效率较低,为了提高任务调度的整体效率,在Map/Reduce基础上提出了一种基于处理时间的DMS任务调度算法。首先,对复杂任务进行预处理,将复杂任务转化为DAG图,依据任务依赖关系大小产生最佳拓扑排序,并依据... 云环境下传统的任务调度算法整体效率较低,为了提高任务调度的整体效率,在Map/Reduce基础上提出了一种基于处理时间的DMS任务调度算法。首先,对复杂任务进行预处理,将复杂任务转化为DAG图,依据任务依赖关系大小产生最佳拓扑排序,并依据排序结果将复杂任务交给work节点进行处理;其次,通过将节点处理任务的预测时间与节点处理能力的比值作为子任务在每个节点的处理"时间"进行量化建模,建立任务和处理时间的度量矩阵,依据DMS算法进行处理,从而获得任务分配最佳方案;最后,从任务调度效率与资源使用率的角度将DMS算法与公平调度算法、遗传算法行对比验证。实验结果表明,DMS算法能明显提高任务调度整体效率,充分利用各节点的计算能力提高了Map/Reduce的调度效率。 展开更多
关键词 云计算 map/reduce 任务调度 差值矩阵
下载PDF
Map/Reduce下快速剪枝算法在复杂任务调度中的应用 被引量:1
5
作者 裴树军 宋冬梅 孔德凯 《计算机科学与探索》 CSCD 北大核心 2018年第1期72-81,共10页
云环境下传统任务分配与调度算法对于复杂任务调度的整体效率较低,为了提高Map/Reduce对复杂任务分配调度的整体效率,提出了一种基于任务处理时间的快速剪枝算法。该算法首先将复杂任务按照任务依赖关系大小进行最佳拓扑排序,使任务按... 云环境下传统任务分配与调度算法对于复杂任务调度的整体效率较低,为了提高Map/Reduce对复杂任务分配调度的整体效率,提出了一种基于任务处理时间的快速剪枝算法。该算法首先将复杂任务按照任务依赖关系大小进行最佳拓扑排序,使任务按顺序执行,从而提高调度准确率。然后使用节点处理任务的预测时间与节点处理能力的比值作为子任务在每个节点的处理时间进行量化建模,建立任务和处理时间的度量矩阵,通过采用按阶剪枝方法逐渐缩小任务分配规模,对N个节点处理N个任务的分配问题,进行N-1次操作可获得任务分配的最优解。运用Hadoop平台进行实验验证,从任务调度效率与资源使用率角度将剪枝算法与公平调度算法、遗传算法和GRAPHENE算法进行对比验证。实验结果表明剪枝算法能明显提高任务调度的整体效率,充分利用各节点的计算能力提高Map/Reduce调度效率。 展开更多
关键词 剪枝算法 map/reduce 任务调度 云计算
下载PDF
动态在线Map/Reduce流数据处理模型及作业拓扑管理协议
6
作者 魏晓辉 李翔 +2 位作者 李洪亮 李聪 庄园 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2015年第5期950-955,共6页
针对海量流数据的在线处理需求,提出一种不同于传统Map/Reduce流数据处理的系统模型Flexible workflow.该模型对workflow处理单元进行在线Map/Reduce并行化,实现了SPATE系统;同时为该系统定义一组关于作业的建立、管理和维护的通信规程... 针对海量流数据的在线处理需求,提出一种不同于传统Map/Reduce流数据处理的系统模型Flexible workflow.该模型对workflow处理单元进行在线Map/Reduce并行化,实现了SPATE系统;同时为该系统定义一组关于作业的建立、管理和维护的通信规程,即拓扑管理协议.SPATE系统解决了在线Map/Reduce流数据处理过程中要求实时性及可扩展性的问题.实验验证了拓扑管理协议的有效性,拓扑管理协议能有效管理Flexible workflow流数据处理模型. 展开更多
关键词 流数据处理 FLEXIBLE workflow模型 map/reduce 拓扑管理
下载PDF
基于Map/Reduce的外壳片段立方体并行计算方法 被引量:4
7
作者 唐珊珊 朱跃龙 朱凯 《计算机工程与应用》 CSCD 北大核心 2015年第22期124-129,共6页
针对高维、维度分层的大数据集,提出一种基于Map/Reduce框架的并行外壳片段立方体构建算法。算法采用Map/Reduce框架,实现外壳片段立方体的并行构建与查询。构建算法在Map过程中,计算出各个数据分块所有可能的数据单元或层次维编码前缀;... 针对高维、维度分层的大数据集,提出一种基于Map/Reduce框架的并行外壳片段立方体构建算法。算法采用Map/Reduce框架,实现外壳片段立方体的并行构建与查询。构建算法在Map过程中,计算出各个数据分块所有可能的数据单元或层次维编码前缀;在Reduce过程中,聚合计算得到最终的外壳片段和度量索引表。实验证明,并行外壳片段立方体算法一方面结合了Map/Reduce框架的并行性和高扩展性,另一方面结合了外壳片段立方体的压缩策略和倒排索引机制,能够有效避免高维数据物化时数据量的爆炸式增长,提供快速构建和查询操作。 展开更多
关键词 联机分析处理 外壳片段立方体 map/reduce技术 并行计算
下载PDF
基于Map/Reduce的网页消重并行算法 被引量:2
8
作者 张元丰 董守斌 +1 位作者 张凌 陈晓志 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期153-156,共4页
网页消重模块是搜索引擎系统的重要组成部分,其作用是对搜索引擎的爬虫系统下载的网页进行过滤,去除重复内容的网页,从而提高搜索引擎爬虫系统的性能和检索的质量。提出了一种网页消重的并行算法以及基于Map/Reduce的实现机制,并通过实... 网页消重模块是搜索引擎系统的重要组成部分,其作用是对搜索引擎的爬虫系统下载的网页进行过滤,去除重复内容的网页,从而提高搜索引擎爬虫系统的性能和检索的质量。提出了一种网页消重的并行算法以及基于Map/Reduce的实现机制,并通过实际网站的实验验证了该消重算法的稳定性和处理大量网页时的并行性能。 展开更多
关键词 搜索引擎 网页消重 map/reduce
下载PDF
基于Map/Reduce的索引数据云存储模型研究 被引量:8
9
作者 陆小丽 何加铭 《宁波大学学报(理工版)》 CAS 2011年第3期29-33,共5页
针对目前搜索引擎引擎系统存在的数据量庞大、访问用户高并发性和搜索延迟性的特点,提出了基于云存储的文档索引分类存储模型,并在索引数据分类存储算法实现过程中,采用基于Map/Reduce编程模型的二次索引词权重计算,以降低分类过程中的... 针对目前搜索引擎引擎系统存在的数据量庞大、访问用户高并发性和搜索延迟性的特点,提出了基于云存储的文档索引分类存储模型,并在索引数据分类存储算法实现过程中,采用基于Map/Reduce编程模型的二次索引词权重计算,以降低分类过程中的模糊粒度.通过实验验证基于该存储模型的算法不仅可以提高海量数据索引库的数据处理效率,而且在一定程度上降低了检索系统查询延迟,提高了搜索效率. 展开更多
关键词 搜索引擎 权重 map/reduce 索引
下载PDF
基于改进的Map/Reduce及模式空间划分的数据挖掘 被引量:4
10
作者 刘骞 陈明 《微电子学与计算机》 CSCD 北大核心 2011年第8期140-142,共3页
为通过Map/Reduce基于键/值对以处理数据集与模式集的多对多的对应关系的方式实现数据挖掘,解决在较复杂的类型的模式的挖掘中存在的由组合爆炸导致的模式集过大的问题,提出了通过模式空间划分实现将处理数据集与模式集的对应关系的问... 为通过Map/Reduce基于键/值对以处理数据集与模式集的多对多的对应关系的方式实现数据挖掘,解决在较复杂的类型的模式的挖掘中存在的由组合爆炸导致的模式集过大的问题,提出了通过模式空间划分实现将处理数据集与模式集的对应关系的问题转化为处理数据集与子模式集的集合的对应关系的问题的方法,并对Map/Reduce集群的调度机制及组织、处理键/值对的方式进行了改进,增强了Map/Reduce执行模式挖掘任务的能力.在Map/Reduce集群上采用该思路实现某些较复杂类型的模式的挖掘算法时的并行度高于Map/Reduce化的传统算法. 展开更多
关键词 改进的map/reduce 集群 多对多映射 模式空间划分 模式编码 数据挖掘
下载PDF
基于Map/Reduce的决策树分类挖掘方法应用研究 被引量:4
11
作者 李根 樊龙 +1 位作者 万定生 余宇峰 《计算机与数字工程》 2016年第8期1504-1510,共7页
传统数据挖掘模式在处理海量、多维、复杂等特征的数据时,存在计算能力弱、效率低、可扩展性差等问题。论文提出基于Map/Reduce的决策树分类挖掘方法(C4.5BH算法),该算法采用K-means聚类方法对连续属性进行离散化,并利用Map/Reduce编程... 传统数据挖掘模式在处理海量、多维、复杂等特征的数据时,存在计算能力弱、效率低、可扩展性差等问题。论文提出基于Map/Reduce的决策树分类挖掘方法(C4.5BH算法),该算法采用K-means聚类方法对连续属性进行离散化,并利用Map/Reduce编程模型和属性表结构实现了决策树构造过程中属性的并行计算和节点的并行分裂。实验证明,与传统的C4.5算法相比,C4.5BH算法在处理大规模数据集时具有更高的执行效率和良好的加速比。 展开更多
关键词 map/reduce技术 K-MEANS算法 决策树 C4.5BH算法
下载PDF
基于Map/Reduce的电力监控系统规则挖掘技术研究 被引量:4
12
作者 刘雨欣 张琼洁 张景景 《控制工程》 CSCD 北大核心 2017年第10期2156-2160,共5页
鉴于电力监控系统的多异类信源和动态融合特性,对系统海量实时监控信息进行故障规则挖掘和预测性监测。针对传统决策树法效率难提升问题,提出一种基于并行框架Map/Reduce和包含度测量相融合的规则挖掘算法(MRDT)。通过构建云计算Hadoop... 鉴于电力监控系统的多异类信源和动态融合特性,对系统海量实时监控信息进行故障规则挖掘和预测性监测。针对传统决策树法效率难提升问题,提出一种基于并行框架Map/Reduce和包含度测量相融合的规则挖掘算法(MRDT)。通过构建云计算Hadoop平台,在其分布式并行计算框架Map/Reduce基础上实现基于包含度的决策树规则挖掘算法的并行处理,高效地提取信任度较高的故障规则。以某水电站实时监控系统的电气信息为例,对MRDT算法进行实验测试,结果表明:MRDT算法在保证传统DT算法规则信任度较高的同时,提高了挖掘效率。 展开更多
关键词 电力监控系统 规则挖掘 预测 map/reduce MRDT 信任度
下载PDF
基于Map/Reduce集群上的模式空间划分的序列模式挖掘 被引量:1
13
作者 刘骞 陈明 《微电子学与计算机》 CSCD 北大核心 2012年第9期149-151,156,共4页
通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1-序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一... 通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1-序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一Map节点的瓶颈问题.通过三轮的Map/Reduce任务,实现了模式空间和过滤规则的建立,并在此基础上实现了各子模式空间上独立地进行序列模式的挖掘.通过充分利用整个模式空间的全局特征及各子模式空间的个性特征,设计了优化的非递归挖掘算法,减少了前缀投影库构造次数及对构造的投影库的扫描次数,从而提高了挖掘阶段的效率. 展开更多
关键词 map/reduce模式空间划分 序列模式挖掘 云计算
下载PDF
基于MAP/REDUCE的移动目标连续轨迹模式挖掘的研究 被引量:1
14
作者 彭茗菁 马传香 李伟亮 《物联网技术》 2014年第10期59-60,63,共3页
针对传统序列模式挖掘算法都是针对单机环境、静态实例以及非连续轨迹的不足,提出了Map/Reduce系统与经过优化的PrefixSpan序列模式挖掘算法相结合的改进型算法。该算法在生成投影数据库时,只有当待投影序列的第一个元素和前缀的最后一... 针对传统序列模式挖掘算法都是针对单机环境、静态实例以及非连续轨迹的不足,提出了Map/Reduce系统与经过优化的PrefixSpan序列模式挖掘算法相结合的改进型算法。该算法在生成投影数据库时,只有当待投影序列的第一个元素和前缀的最后一个元素相同时才会被选中,保证了挖掘出的都是连续轨迹片段。同时采用并行处理的方法,使用Map函数构建每个频繁序列前缀对应的投影数据库,使用Reduce函数整合所有的中间键值对得到需要的结果。 展开更多
关键词 map/reduce模型 改进型PrefixSpan算法 轨迹模式 数据挖掘
下载PDF
基于云计算的Web数据挖掘Map/Reduce算法的研究 被引量:3
15
作者 王勃 徐静 《计算机与数字工程》 2014年第7期1157-1159,1164,共4页
随着互联网技术的广泛应用,网络上处理海量数据成为网络发展的关键,论文主要介绍了基于云计算的Web数据挖掘Map/Reduce算法的研究,提出了Map/Reduce算法的模型,建立体系架构,通过实验,云计算与该算法相结合,提高了数据挖掘的效率,与计... 随着互联网技术的广泛应用,网络上处理海量数据成为网络发展的关键,论文主要介绍了基于云计算的Web数据挖掘Map/Reduce算法的研究,提出了Map/Reduce算法的模型,建立体系架构,通过实验,云计算与该算法相结合,提高了数据挖掘的效率,与计算仿真平台的以及在该平台下采用虚拟化技术对子云层进行整合,为Web Service提供服务的关键技术,最大限度的发挥了其可用性、协同性、扩展性等特点。 展开更多
关键词 云计算 WEB数据挖掘 map reduce算法
下载PDF
基于Map/Reduce的分布式搜索引擎研究 被引量:9
16
作者 吴宝贵 丁振国 《现代图书情报技术》 CSSCI 北大核心 2007年第8期52-55,共4页
在对Map/Reduce算法进行分析的基础上,利用开源Hadoop软件设计出高容错高性能的分布式搜索引擎,以面对搜索引擎对海量数据的处理和存储问题。
关键词 映射/规约 分布式搜索引擎 HADOOP
下载PDF
基于Map/Reduce的并行异常报文生成引擎系统的设计与实现
17
作者 郎轶 《数字技术与应用》 2016年第3期172-172,共1页
Hadoop Map/reduce是一种基于并行处理分布式架构的软件框架。本文在开源软件Hadoop Map/reduce的基础之上,将传统的异常报文串行生成算法并行化。Map/reduce框架是展开容错处理和保持负载均衡的一种框架。根据网络协议分层透明设计的原... Hadoop Map/reduce是一种基于并行处理分布式架构的软件框架。本文在开源软件Hadoop Map/reduce的基础之上,将传统的异常报文串行生成算法并行化。Map/reduce框架是展开容错处理和保持负载均衡的一种框架。根据网络协议分层透明设计的原理,将报文采用类Wireshark模块进行解析成字段,设计并实现了并行的异常报文生成算法。 展开更多
关键词 map/reduce 并行计算 异常报文
下载PDF
聚类算法的Map/Reduce并行编程框架
18
作者 郑欣阳 王艳 《信息与电脑》 2016年第5期74-75,共2页
数据挖掘算法在经济学中的应用显示了其商业潜力。聚类算法的Map/Reduce并行程序能处理大数据,因此,研究Map/Reduce针对某一个具体问题的编程过程具有现实意义。笔者提供了聚类算法的Map/Reduce编程方式和C++语言并行程序。
关键词 聚类算法 map/reduce编程 簇中心
下载PDF
基于Map/Reduce框架实现的倒排索引文本检索
19
作者 马飞 《智能城市》 2019年第11期48-50,共3页
倒排索引在搜索引擎检索系统中有很广泛的应用前景。而随着互联网各种数据的不断聚集,单处理器早已无法满足对数据的处理。文章介绍了基于Map/Reduce框架下通过多节点实现多个文本的倒排索引技术,详细阐述了在多处理器下倒排索引实现的... 倒排索引在搜索引擎检索系统中有很广泛的应用前景。而随着互联网各种数据的不断聚集,单处理器早已无法满足对数据的处理。文章介绍了基于Map/Reduce框架下通过多节点实现多个文本的倒排索引技术,详细阐述了在多处理器下倒排索引实现的原理。并根据目前倒排索引在各大搜索引擎的应用状况,结合在试验中获得的相关数据,进一步探索了在Map/Reduce框架下倒排索引文本的有效性和效率。 展开更多
关键词 倒排索引 map/reduce 多处理器 有效性
下载PDF
基于Map/Reduce并行编程模型的XBRL维度数据解析算法 被引量:1
20
作者 朱健鹏 王颖 杨诚 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2014年第1期124-129,共6页
从XBRL维度数据处理的角度,研究大规模半结构化数据处理技术,提出一种基于Map/Reduce并行编程模型的XBRL维度数据解析算法.该算法在Map/Reduce编程模型和StAX流式解析技术的基础上,针对XBRL财务报告中各XML文件之间较复杂的数据引用关系... 从XBRL维度数据处理的角度,研究大规模半结构化数据处理技术,提出一种基于Map/Reduce并行编程模型的XBRL维度数据解析算法.该算法在Map/Reduce编程模型和StAX流式解析技术的基础上,针对XBRL财务报告中各XML文件之间较复杂的数据引用关系,以整份XBRL财务报告为处理的最小单位,结合并行技术提取维度事项所包含的数据,再处理业务语义数据,从而实现复杂XBRL维度数据的解析.性能比较分析表明,该算法在大规模XBRL数据处理方面具有显著优势. 展开更多
关键词 XBRL 半结构化数据处理 大数据处理 map reduce XBRL维度
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部