期刊文献+

基于Hadoop的C4.5决策树分类算法并行化 被引量:3

The parallelization of C4.5 algorithm based on Hadoop
下载PDF
导出
摘要 通过研究各种决策树分类算法的并行方案后,并行设计C4.5算法。同时根据Hadoop云平台的MapReduce编程模型,详细描述C4.5并行算法在MapReduce编程模型下的实现及其执行流程。最后,对输入的海量文本数据进行分类,验证了算法的高效性和扩展性。 In this paper, a parallel C4.5 algorithm is put forward by the study of a variety of decision tree classification algo rithm parallel programs and the MapReduce programming model of the Hadoop cloud computing platform. At the same time, the ex ecution flow of the C4.5 parallel algorithms in the MapReduce programming model is introduced. Finally, the input of mass text da ta is classificated to verify the efficiency and scalability of the algorithm.
出处 《微型机与应用》 2013年第12期85-87,91,共4页 Microcomputer & Its Applications
基金 福建省科技计划重点项目(2011H0028)
关键词 云计算 HADOOP MAPREDUCE 数据分类 C4 5算法 并行 cloud computing Hadoop MapReduce data classification C4.5 algorithm parallel
  • 相关文献

参考文献3

  • 1刘鹏.云计算[M]北京:电子工业出版社,2010.
  • 2陆嘉恒.Hadoop实战[M]北京:机械工业出版社,2011.
  • 3田金兰,赵庆玉.并行决策树算法的研究[J].计算机工程与应用,2001,37(20):112-114. 被引量:6

二级参考文献4

  • 1-.MineSet2.0 Tutorial.SGI公司数据挖掘系统技术文档[M].,..
  • 2田金兰,计算机世界,1999年
  • 3高文,计算机世界,1998年
  • 4Mine Set 2.0 Tutorial

共引文献5

同被引文献17

引证文献3

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部