-
题名并行决策树算法的研究
被引量:6
- 1
-
-
作者
田金兰
赵庆玉
-
机构
清华大学计算机科学与技术系软件所
-
出处
《计算机工程与应用》
CSCD
北大核心
2001年第20期112-114,140,共4页
-
文摘
数据挖掘在科研和商业应用中正发挥着越来越重要的作用。随着数据量的增加,数据挖掘工具处理海量数据的能力问题显得日益突出。研究并行算法,是解决这个问题的有效途径。分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器。文章首先介绍了分类器中的决策树算法,然后设计了一种并行决策树算法,最后探讨了该并行算法在PVM系统下的实现。
-
关键词
数据挖掘
数据库
知识发现
并行决策树算法
-
Keywords
data mining,classifier,decision tree,parallel process,pvm system
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于纵向划分数据集的并行决策树分类算法
被引量:2
- 2
-
-
作者
严胜祥
吴绍春
吴耿锋
金沈杰
-
机构
上海大学计算机工程与科学学院
-
出处
《计算机工程与科学》
CSCD
2004年第7期67-70,共4页
-
基金
上海市科学技术发展基金资助项目 ( 0 1J14 0 2 2 )
上海市教委"第四期重点学科"项目 ( 2 0 5 15 3 )
-
文摘
本文提出了一种处理多属性数据集的快速可扩展性并行分类算法—FSPC算法。它首次采用了纵向划分数据集以及在测试属性的选择过程中同步划分数据集等方法。实验结果表明 ,它不仅有利于减少通信及进行I/O的开销 ,而且有利于提高算法的并行度。
-
关键词
数据挖掘
数据仓库
数据集
并行分类算法
FSPC算法
决策树
数据库
-
Keywords
data mining
parallel processing
scalability
decision tree
classification
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-