期刊文献+

基于Hadoop平台的用户行为挖掘 被引量:6

User Behavior Mining Based on Hadoop platform
下载PDF
导出
摘要 随着互联网发展带来的数据爆炸,使得Web日志的数据量也越来越大,如何从海量的Web日志中挖掘有价值的信息成为了目前研究的热点。本文提出基于Hadoop集群框架对Web日志进行挖掘。实验结果表明,该集群系统既可以处理海量的web日志,同时也能够挖掘出有价值的信息,并证实了利用sqoop在Hive仓库和传统数据库之间数据迁移的可行性。 The rapid development of Internet brings data explosion,so web log data is becoming bigger and bigger.How to mine valuable information from huge amounts of Web log becomes the focus of present study.This paper presented Web log mining based on the Hadoop cluster framework.Experimental results show that this cluster system can process massive web log data,and can mine valuable information.And it is confirmed to be feasible that the data migrates between Hive warehouse and traditional database by using sqoop.
出处 《计算技术与自动化》 2015年第2期100-103,共4页 Computing Technology and Automation
基金 科技部科技支撑计划课题项目(2013BAJ10B14-5) 湖南省自然科学基金面上课题项目(14JJ2115) 湖南省教育厅科研重点项目(14A037)
关键词 WEB日志 HADOOP Sqoop Hive 数据迁移 Web log Hadoop Sqoop Hive data migration
  • 相关文献

参考文献8

  • 1李彬,刘莉莉.基于MapReduce的Web日志挖掘[J].计算机工程与应用,2012,48(22):95-98. 被引量:15
  • 2陆嘉恒.Hadoop实战[M].北京:机械工业出版社,2012:2-7.
  • 3朱湘,金松昌,贾焰.一种基于Hadoop平台的海量web数据挖掘系统研究与实现[C]//张新生.中国通信学会-第九届中国通信学会学术年会论文集.北京:北京邮电大学出版社,2012:72-76.
  • 4程苗,陈华平.基于Hadoop的Web日志挖掘[J].计算机工程,2011,37(11):37-39. 被引量:64
  • 5TING K, CECHO J J. Apache Sqoop Cookbook[M]. OReil ly Media, Inc. , 2013.
  • 6DEAN J, GHEMAWAT S. processing on large clusters[J] ,2008, 51(1): 107-11a.
  • 7MapReduce.. simplified data Communications of the ACM THUSOO A, SARMA J S, JAIN N, et al. Hive: a ware- housing solution over a map-reduce framework[J]. Proceed- ings of the VLDB Endowment, 2009, 2(2): 1626-1629.
  • 8GEORGE L. HBase: the definitive guide[M]. O'Reilly Media, Inc. , 2011.

二级参考文献12

共引文献77

同被引文献44

引证文献6

二级引证文献44

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部