期刊文献+
共找到161篇文章
< 1 2 9 >
每页显示 20 50 100
Risk Analysis of Big Data Based on Cloud Computing for the Inspection and Testing of Toxic and Hazardous Substances in Meat Products 被引量:4
1
作者 Yajie WANG Jinlin HE +4 位作者 Peng WANG Jiao DAI Bing YANG Hong TAN Guangcan TAO 《Asian Agricultural Research》 2017年第8期95-100,共6页
Large-scale data emerge in food safety inspection and testing industry with the development of Internet technology in China.This paper was aimed at designing toxic and hazardous substance big data risk analysis algori... Large-scale data emerge in food safety inspection and testing industry with the development of Internet technology in China.This paper was aimed at designing toxic and hazardous substance big data risk analysis algorithm in food safety inspection and testing based on cloud computing^([1]).Cloud computing platform was set up to store the massive extensive data with geographical distribution,dynamic and high complexity from the Internet,and MapReduce^([2]) computational framework in cloud computing was applied to process and compute parallel data.The risk analysis results were obtained by analyzing 1000000 meat products testing data collected from the laboratory management information system based on web.The results show that food safety index IFS < 1,which proves that the food safety state is in good condition. 展开更多
关键词 cloud computing mapreduce Toxic and hazardous substances Food safety risk analysis
下载PDF
Hadoop平台中MapReduce调度算法研究 被引量:11
2
作者 徐焕良 翟璐 +1 位作者 薛卫 任守纲 《计算机应用与软件》 CSCD 2015年第5期1-6,16,共7页
MapReduce是一种新型的并行计算框架,在计算速度,容错性,可靠性等方面具有优势,因此得到了广泛的商业应用与科学研究。而调度算法作为MapReduce的核心组成部分,它的优劣成为了直接影响MapReduce性能的关键因素,因而得到了很大的关注。... MapReduce是一种新型的并行计算框架,在计算速度,容错性,可靠性等方面具有优势,因此得到了广泛的商业应用与科学研究。而调度算法作为MapReduce的核心组成部分,它的优劣成为了直接影响MapReduce性能的关键因素,因而得到了很大的关注。在介绍和分析MapReduce并行计算模型的基础上,介绍了几种相关的模型改进,并基于Hadoop平台,重点研究了MapReduce的常用调度算法及改进算法。通过对比分析,就MapReduce未来的发展进行了进一步的探讨,为其调度算法的改进提供有效的方法。 展开更多
关键词 云计算 并行计算模型 hadoop mapreduce 调度算法
下载PDF
基于Hadoop的MapReduce模型的研究与改进 被引量:36
3
作者 李玉林 董晶 《计算机工程与设计》 CSCD 北大核心 2012年第8期3110-3116,共7页
针对MapReduce模型中存在的多个Reduce任务之间完成时间差别较大的问题,分析了影响Reduce任务完成时间的因素,指出了MapReduce模型中Reduce任务节点存在数据倾斜问题,提出了一种改进型的MapReduce模型MBR(Map-Balance-Reduce)模型。通... 针对MapReduce模型中存在的多个Reduce任务之间完成时间差别较大的问题,分析了影响Reduce任务完成时间的因素,指出了MapReduce模型中Reduce任务节点存在数据倾斜问题,提出了一种改进型的MapReduce模型MBR(Map-Balance-Reduce)模型。通过添加Balance任务,对Map任务处理完成的中间数据进行均衡操作,使得分配到Reduce任务节点的数据比较均衡,从而确保Reduce任务的完成时间基本一致。仿真实验结果表明,经过Balance任务后,Map任务产生的中间数据能够比较均衡的分配给Reduce任务节点,达到数据计算均衡的目的,在一定程度上减少了整个作业的执行时间。 展开更多
关键词 mapreduce模型 hadoop 数据倾斜 云计算 并行编程
下载PDF
基于Hadoop的贝叶斯过滤MapReduce模型 被引量:3
4
作者 曾青华 袁家斌 张云洲 《计算机工程》 CAS CSCD 2013年第11期57-60,64,共5页
传统分布式大型邮件系统对海量邮件的过滤存在编程难、效率低、前期训练耗用资源大等缺点,为此,对传统贝叶斯过滤算法进行并行化改进,利用云计算MapReduce模型在海量数据处理方面的优势,设计一种基于Hadoop开源云架构的贝叶斯邮件过滤Ma... 传统分布式大型邮件系统对海量邮件的过滤存在编程难、效率低、前期训练耗用资源大等缺点,为此,对传统贝叶斯过滤算法进行并行化改进,利用云计算MapReduce模型在海量数据处理方面的优势,设计一种基于Hadoop开源云架构的贝叶斯邮件过滤MapReduce模型,优化邮件的训练和过滤过程。实验结果表明,与传统分布式计算模型相比,该模型在召回率、查准率和精确率方面性能较好,同时可降低邮件过滤成本,提高系统执行效率。 展开更多
关键词 云计算 mapreduce模型 hadoop架构 贝叶斯算法 垃圾邮件 反垃圾邮件过滤
下载PDF
Hadoop平台下MapReduce模型的数据分配策略研究 被引量:1
5
作者 余基映 张腾 《湖北民族学院学报(自然科学版)》 CAS 2015年第2期205-209,共5页
针对Hadoop开源云计算平台下MapReduce并行编程模型中间数据分配不均衡的问题,提出基于抽样的改进型MapReduce模型,即SMR(Sample MapReduce)模型.SMR模型采用MapReduce作业方式对各分块数据集进行并行抽样,基于抽样结果,利用LAB(leen an... 针对Hadoop开源云计算平台下MapReduce并行编程模型中间数据分配不均衡的问题,提出基于抽样的改进型MapReduce模型,即SMR(Sample MapReduce)模型.SMR模型采用MapReduce作业方式对各分块数据集进行并行抽样,基于抽样结果,利用LAB(leen and balance)均衡算法对Map端输出的中间数据进行均衡分配,以改善Reduce端处理数据负载不均衡问题.实验结果表明:改进型MapReduce模型可以有效减少作业运行时间,Reduce端输入数据达到负载均衡. 展开更多
关键词 云计算 mapreduce模型 hadoop 数据分配
下载PDF
基于Hadoop平台的高阶矩阵相乘MapReduce算法研究 被引量:4
6
作者 向林泓 陈芋文 张昱琳 《计算机科学》 CSCD 北大核心 2013年第06A期96-98,共3页
目前,针对基于单一节点的中高阶矩阵相乘存在着计算瓶颈,甚至因内存溢出导致计算机崩溃等问题,结合利用云计算分布式处理和虚拟化技术的优势,提出一种基于Hadoop平台的高阶矩阵相乘的MapReduce算法。实验结果表明:该算法能够有效地解决... 目前,针对基于单一节点的中高阶矩阵相乘存在着计算瓶颈,甚至因内存溢出导致计算机崩溃等问题,结合利用云计算分布式处理和虚拟化技术的优势,提出一种基于Hadoop平台的高阶矩阵相乘的MapReduce算法。实验结果表明:该算法能够有效地解决高阶矩阵相乘中存在的计算瓶颈问题,同时提高了计算效率。 展开更多
关键词 mapreduce 高阶矩阵相乘 云计算 hadoop平台
下载PDF
基于Hadoop MapReduce的大规模线性有限元法并行实现 被引量:3
7
作者 林海铭 《计算机应用与软件》 2017年第3期21-26,共6页
面对越来越复杂的工程问题,单机上的有限元计算不能达到完全解决问题的程度,可以考虑利用新兴云计算技术来解决。设计合适的杆单元数据结构,提出基于MapReduce框架的线性有限单元法并行算法,包括总体刚度阵组装和CG法求解线性方程组。在... 面对越来越复杂的工程问题,单机上的有限元计算不能达到完全解决问题的程度,可以考虑利用新兴云计算技术来解决。设计合适的杆单元数据结构,提出基于MapReduce框架的线性有限单元法并行算法,包括总体刚度阵组装和CG法求解线性方程组。在6节点Hadoop实验集群上,通过大规模空间桁架结构进行数值验证。结果表明采用该算法求解大规模空间桁架结构简洁、易用;在总刚组装阶段,网格模型越大,计算节点越多,计算性能越好;但求解方程组阶段,计算性能不理想,有待改善。 展开更多
关键词 云计算hadoop mapreduce 线性有限元 空间桁架 并行计算
下载PDF
MapReduce在Hadoop平台下作业调度算法的改进和实现 被引量:1
8
作者 解慧娟 《电脑知识与技术(过刊)》 2014年第5X期3206-3208,3211,共4页
该文在Hadoop实现的MapReduce架构基础上,分析了现有的三种作业调度算法,针对当前算法没有考虑服务器负载状况和数据本地性差的缺点,提出了基于可变长度队列的公平调度算法(FSVQ),该算法分析了空闲节点率,并通过采取等待的办法满足考虑... 该文在Hadoop实现的MapReduce架构基础上,分析了现有的三种作业调度算法,针对当前算法没有考虑服务器负载状况和数据本地性差的缺点,提出了基于可变长度队列的公平调度算法(FSVQ),该算法分析了空闲节点率,并通过采取等待的办法满足考虑数据本地性。实验证明该算法可增加服务器集群的工作效率,减少网络延迟,具有实际的应用意义。 展开更多
关键词 云计算 mapreduce hadoop 调度算法 负载 数据本地性
下载PDF
基于Hadoop MapReduce的大规模雷电电磁传播数值仿真 被引量:1
9
作者 林海铭 《计算机应用与软件》 CSCD 2016年第11期66-70,89,共6页
面对大规模雷电电磁问题,单机计算不能达到完全解决问题的程度,可以考虑利用新兴云计算技术来解决。提出基于Hadoop MapReduce框架的域分解时域有限差分并行算法,在6节点的Hadoop实验室集群上,对上海浦东某地区发生的大规模雷电电磁传... 面对大规模雷电电磁问题,单机计算不能达到完全解决问题的程度,可以考虑利用新兴云计算技术来解决。提出基于Hadoop MapReduce框架的域分解时域有限差分并行算法,在6节点的Hadoop实验室集群上,对上海浦东某地区发生的大规模雷电电磁传播过程进行数值仿真,并测试不同计算子域所获得的加速比。计算结果显示,所提出的并行算法能有效地求解大规模雷电电磁传播问题,且计算模型越大、计算节点越多,加速比也大,在设定的计算环境下,最大加速比为2.4,受硬盘空间限制,最大计算规模为1 368万节点。 展开更多
关键词 云计算 hadoop mapreduce 雷电 有限差分法 并行计算
下载PDF
Offline traffic analysis system based on Hadoop 被引量:4
10
作者 QIAO Yuan-yuan LEI Zhen-ming +1 位作者 YUAN Lun GUO Min-jie 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2013年第5期97-103,共7页
Offiine network traffic analysis is very important for an in-depth study upon the understanding of network conditions and characteristics, such as user behavior and abnormal traffic. With the rapid growth of the amoun... Offiine network traffic analysis is very important for an in-depth study upon the understanding of network conditions and characteristics, such as user behavior and abnormal traffic. With the rapid growth of the amount of information on the Intemet, the traditional stand-alone analysis tools face great challenges in storage capacity and computing efficiency, but which is the advantages for Hadoop cluster. In this paper, we designed an offiine traffic analysis system based on Hadoop (OTASH), and proposed a MapReduce-based algorithm for TopN user statistics. In addition, we studied the computing performance and failure tolerance in OTASH. From the experiments we drew the conclusion that OTASH is suitable for handling large amounts of flow data, and are competent to calculate in the case of single node failure. 展开更多
关键词 mapreduce hadoop cloud computing traffic analysis
原文传递
基于MapReduce的海量数据挖掘技术研究 被引量:35
11
作者 李伟卫 赵航 +1 位作者 张阳 王勇 《计算机工程与应用》 CSCD 2013年第20期112-117,共6页
MapReduce是一种编程模型,可以运行在异构环境下,编程简单,不必关心底层实现细节,用于大规模数据集的并行运算。将MapReduce应用在数据挖掘的三个算法中:朴素贝叶斯分类算法、K-modes聚类算法和ECLAT频繁项集挖掘算法。实验结果表明,在... MapReduce是一种编程模型,可以运行在异构环境下,编程简单,不必关心底层实现细节,用于大规模数据集的并行运算。将MapReduce应用在数据挖掘的三个算法中:朴素贝叶斯分类算法、K-modes聚类算法和ECLAT频繁项集挖掘算法。实验结果表明,在保证算法准确率的前提下,MapReduce可以有效提高海量数据挖掘工作的效率。 展开更多
关键词 云计算 数据挖掘 hadoop mapreduce
下载PDF
基于MapReduce的K-Medoids并行算法 被引量:33
12
作者 张雪萍 龚康莉 赵广才 《计算机应用》 CSCD 北大核心 2013年第4期1023-1025,1035,共4页
为了解决传统K-Medoids聚类算法在处理海量数据信息时所面临的内存容量和CPU处理速度的瓶颈问题,在深入研究K-Medoids算法的基础之上,提出了基于MapReduce编程模型的K-Medoids并行化算法思想。Map函数部分的主要任务是计算每个数据对象... 为了解决传统K-Medoids聚类算法在处理海量数据信息时所面临的内存容量和CPU处理速度的瓶颈问题,在深入研究K-Medoids算法的基础之上,提出了基于MapReduce编程模型的K-Medoids并行化算法思想。Map函数部分的主要任务是计算每个数据对象到簇类中心点的距离并(重新)分配其所属的聚类簇;Reduce函数部分的主要任务是根据Map部分得到的中间结果,计算出新簇类的中心点,然后作为中心点集给下一次MapReduce过程使用。实验结果表明:运行在Hadoop集群上的基于MapReduce的K-Medoids并行化算法具有较好的聚类结果和可扩展性,对于较大的数据集,该算法得到的加速比更接近于线性。 展开更多
关键词 K-Medoids 云计算 mapreduce 并行计算 hadoop
下载PDF
基于MapReduce计算模型的气象资料处理调优试验 被引量:8
13
作者 杨润芝 沈文海 +4 位作者 肖卫青 胡开喜 杨昕 王颖 田伟 《应用气象学报》 CSCD 北大核心 2014年第5期618-628,共11页
云计算技术使用分布式的计算技术实现了并行计算的计算能力和计算效率,解决了单机服务器计算能力低的问题。基于长序列历史资料所计算得出的气候标准值对于气象领域实时业务、准实时业务及科学研究中均具有重要的意义。由于长序列历史... 云计算技术使用分布式的计算技术实现了并行计算的计算能力和计算效率,解决了单机服务器计算能力低的问题。基于长序列历史资料所计算得出的气候标准值对于气象领域实时业务、准实时业务及科学研究中均具有重要的意义。由于长序列历史资料数据量大、运算逻辑较复杂,在传统单节点计算平台上进行整编计算耗时非常长。该文基于Hadoop分布式计算框架搭建了集群模式的云计算平台,以长序列历史资料作为源数据,基于MapReduce计算模型实现了部分整编算法,提高计算时效。同时,由于数据源本身具有文件个数多、单个文件小等特点,对数据源存储形式及数据文件大小进行改造,分别利用SequenceFile方式及文本文件合并方式对同一种场景进行计算时效对比测试,分别测试了10个文件合并、100个文件合并两种情况,使时效性得到了更大程度的提升。 展开更多
关键词 mapreduce 云计算 hadoop 历史资料整编
下载PDF
并行MapReduce PLS算法及其在光谱分析中的应用 被引量:5
14
作者 杨辉华 杜玲玲 +5 位作者 李灵巧 唐天彪 郭拓 梁琼麟 王义明 罗国安 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2012年第9期2399-2404,共6页
偏最小二乘(PLS)算法是常用的光谱建模算法,然而对于海量光谱处理情形,在单台计算机上建模及优化时间开销很大。基于MapReduce编程模式,提出了并行MapReduce PLS回归算法,包括并行数据标准化和并行主成分提取两个过程。在多台普通计算... 偏最小二乘(PLS)算法是常用的光谱建模算法,然而对于海量光谱处理情形,在单台计算机上建模及优化时间开销很大。基于MapReduce编程模式,提出了并行MapReduce PLS回归算法,包括并行数据标准化和并行主成分提取两个过程。在多台普通计算机上搭建Hadoop云计算集群平台,以近红外光谱处理为例,开展了算法验证实验。实验结果表明,基于MapReduce编程模式的并行PLS算法对海量近红外光谱数据集进行回归建模时,能有效提高建模速度,随计算机台数的增多可得到接近线性的加速比,并具有良好的扩展性。 展开更多
关键词 并行偏最小二乘 近红外光谱 mapreduce 并行计算 hadoop 云计算
下载PDF
适于进化算法的迭代式MapReduce框架 被引量:16
15
作者 金伟健 王春枝 《计算机应用》 CSCD 北大核心 2013年第12期3591-3595,共5页
MapReduce模块化的编程大大降低了分布式算法的实现难度,但同时也限制了它的应用范围。介绍了MapReduce的基本结构及其实现迭代算法的缺陷,并针对基于MapReduce进化算法效率低下的问题,在对MapReduce的计算框架进行研究的基础上提出了... MapReduce模块化的编程大大降低了分布式算法的实现难度,但同时也限制了它的应用范围。介绍了MapReduce的基本结构及其实现迭代算法的缺陷,并针对基于MapReduce进化算法效率低下的问题,在对MapReduce的计算框架进行研究的基础上提出了一种适用于进化算法的迭代式MapReduce计算框架。描述了迭代式MapReduce计算框架的实现需求及其具体实现,提出并证明了异常机制的可行性,且在公有的Hadoop云计算平台上对提出的框架进行了验证。实验结果表明,基于迭代式MapReduce计算框架的并行遗传算法在算法的加速比上与基于MapReduce的并行遗传算法相比有较大的提高。 展开更多
关键词 云计算 mapreduce 进化算法 迭代 hadoop
下载PDF
基于MapReduce的微博用户搜索排名算法 被引量:12
16
作者 梁秋实 吴一雷 封磊 《计算机应用》 CSCD 北大核心 2012年第11期2989-2993,共5页
在微博搜索领域,单纯依赖于粉丝数量的搜索排名使刷粉行为有了可乘之机,通过将用户看作网页,将用户间的"关注"关系看作网页间的链接关系,使PageRank关于网页等级的基本思想融入到微博用户搜索,并引入一个状态转移矩阵和一个... 在微博搜索领域,单纯依赖于粉丝数量的搜索排名使刷粉行为有了可乘之机,通过将用户看作网页,将用户间的"关注"关系看作网页间的链接关系,使PageRank关于网页等级的基本思想融入到微博用户搜索,并引入一个状态转移矩阵和一个自动迭代的MapReduce工作流将计算过程并行化,进而提出一种基于MapReduce的微博用户搜索排名算法。在Hadoop平台上对该算法进行了实验分析,结果表明,该算法避免了用户排名单纯与其粉丝数量相关,使那些更具"重要性"的用户在搜索结果中的排名获得提升,提高了搜索结果的相关性和质量。 展开更多
关键词 微博搜索 云计算 mapreduce编程模型 hadoop平台/系统 PAGERANK算法
下载PDF
异构资源环境下的MapReduce性能优化 被引量:15
17
作者 陶永才 石磊 《小型微型计算机系统》 CSCD 北大核心 2013年第2期287-292,共6页
针对现有Hadoop难以适应异构资源环境的不足,提出一种自适应MapReduce调度器:CloudMR.基于数据局部性,CloudMR将同一机架内的<key,value>对进行本地归约合并,减少中间结果中<key,value>对的数目,从而减少机架间的数据传送.... 针对现有Hadoop难以适应异构资源环境的不足,提出一种自适应MapReduce调度器:CloudMR.基于数据局部性,CloudMR将同一机架内的<key,value>对进行本地归约合并,减少中间结果中<key,value>对的数目,从而减少机架间的数据传送.根据资源性能和任务特征,CloudMR动态确定节点任务槽数和数据分配量.对于计算性能高的节点,CloudMR分配较多的任务和数据量,而对于计算性能低的节点,相应地减轻任务和数据量负载.实验表明,在异构环境下,较之现有Hadoop,Cloud-MR减少了节点间数据传输和备份任务运行,缩短了作业完成时间. 展开更多
关键词 云计算 异构资源 mapreduce hadoop
下载PDF
基于MapReduce模型的并行量子进化算法 被引量:6
18
作者 贾瑞玉 刘范范 +1 位作者 潘雯雯 王伟东 《计算机工程》 CAS CSCD 2012年第8期180-182,188,共4页
利用MapReduce模型可自动编写串行程序及编程接口简单的优点,实现量子进化算法在MapReduce模型下的并行化,提出基于MapReduce模型的并行量子进化算法MRQEA,并将其部署到Hadoop云计算平台上运行。对0-1背包问题的测试结果证明,MRQEA算法... 利用MapReduce模型可自动编写串行程序及编程接口简单的优点,实现量子进化算法在MapReduce模型下的并行化,提出基于MapReduce模型的并行量子进化算法MRQEA,并将其部署到Hadoop云计算平台上运行。对0-1背包问题的测试结果证明,MRQEA算法在处理大型数据集时具有良好的加速比和并行效率。 展开更多
关键词 量子进化算法 mapreduce模型 云计算平台 hadoop平台
下载PDF
不同MapReduce运行系统的性能测试与分析 被引量:3
19
作者 易修文 李天瑞 +1 位作者 张钧波 滕飞 《计算机科学》 CSCD 北大核心 2015年第5期24-27,50,共5页
随着云计算技术的发展,许多MapReduce运行系统被开发出来,如Hadoop、Phoenix和Twister等。直观上,Hadoop具有很强的可扩展性、稳定性,适合处理大规模离线应用;Phoenix具有运行速度快等优点,适合处理数据密集型任务;Twister是轻量级的迭... 随着云计算技术的发展,许多MapReduce运行系统被开发出来,如Hadoop、Phoenix和Twister等。直观上,Hadoop具有很强的可扩展性、稳定性,适合处理大规模离线应用;Phoenix具有运行速度快等优点,适合处理数据密集型任务;Twister是轻量级的迭代系统,非常适合迭代式的应用。不同的应用在不同的MapReduce运行系统中有着不同的性能。通过测试不同应用在这些运行系统上的性能,给出了实验比较和性能分析,从而为大数据处理时选择合适的并行编程模型提供依据。 展开更多
关键词 云计算 mapreduce hadoop PHOENIX TWISTER
下载PDF
基于匹配规则的MapReduce任务调度模型 被引量:7
20
作者 金伟健 王春枝 《计算机应用》 CSCD 北大核心 2014年第4期1010-1013,1018,共5页
基于开源云计算平台Hadoop的MapReduce是当前流行的分布式计算框架之一,然而其先进先出(FIFO)调度算法存在资源利用效率低下的问题。提出了一种基于资源匹配规则的MapReduce任务调度模型并进行了算法实现。该调度模型通过获取任务的资... 基于开源云计算平台Hadoop的MapReduce是当前流行的分布式计算框架之一,然而其先进先出(FIFO)调度算法存在资源利用效率低下的问题。提出了一种基于资源匹配规则的MapReduce任务调度模型并进行了算法实现。该调度模型通过获取任务的资源需求与计算节点的剩余资源,依据资源的匹配性进行任务分配,提高了系统的资源使用效率。首先对MapReduce的调度过程进行建模,提出了资源及匹配度的量化定义和相应的计算公式;然后给出了资源测量的具体方法及算法实现;最后利用TeraSort、GrepCount和WordCount任务与FIFO调度算法进行实验对比,实验结果显示,最好的情况下,提出的调度模型任务完成时间减少了22.19%,而最差情况下的吞吐量也提高了25.39%。 展开更多
关键词 云计算 调度算法 hadoop mapreduce 先进先出
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部