期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向DNS日志的MapReduce性能优化技术研究 被引量:1
1
作者 刘鹤煜 张棪 +2 位作者 杨兴华 崔华俊 谭倩 《智能计算机与应用》 2018年第2期73-77,共5页
DNS日志是互联网中重要的访问日志,数量巨大且承载着大量信息,需要借助大数据技术进行处理和分析。现网DNS日志数据量大,且数据倾斜现象严重,对MapReduce的性能有较为严重的影响。基于上述问题,采用小文件合并方法优化分片,缓解Map端的... DNS日志是互联网中重要的访问日志,数量巨大且承载着大量信息,需要借助大数据技术进行处理和分析。现网DNS日志数据量大,且数据倾斜现象严重,对MapReduce的性能有较为严重的影响。基于上述问题,采用小文件合并方法优化分片,缓解Map端的数据倾斜问题,并实现动态设置分片大小,提高MapReduce作业执行效率。该方法有效均衡了Map任务的负载,从而提高了数据倾斜情况下的MapReduce作业的执行效率和资源利用率。实验表明,使用该方法可以有效缩短MapReduce作业的执行时间。 展开更多
关键词 DNS日志 数据倾斜 MAPREDUCE 性能优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部