-
题名决策树算法的并行性研究
被引量:26
- 1
-
-
作者
郭景峰
米浦波
刘国华
-
机构
燕山大学计算机科学系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第8期77-78,共2页
-
基金
河北省自然科学基金资助项目()600225
-
文摘
在数据库和数据仓库中运用数据挖掘技术必须考虑挖掘系统的速度问题。当数据集大到相当程度时,挖掘工作只能在巨型机上进行;而由于系统的速度不够快,挖掘出来的知识将会是滞后的,它对决策支持不仅无效甚至是有害的。针对这一问题,提出了决策树算法的并行机制,并对并行性的性能进行探讨。
-
关键词
决策树算法
并行性
数据挖掘
数据库
计算机
-
Keywords
Data mining
Decision tree
Parallelism
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于决策树的数据遗失值填充方法的研究
被引量:6
- 2
-
-
作者
郭景峰
米浦波
刘国华
-
机构
燕山大学信息科学与工程学院
-
出处
《计算机工程与科学》
CSCD
2002年第5期8-10,共3页
-
基金
河北省自然科学基金资助项目 (60 0 2 2 5 )
-
文摘
数据遗失值填充问题是预处理过程中的一个难点。已有的算法大多寻求数据中属性值之间的关系、属性与属性值之间的关系、属性与属性间的关系来对遗失值进行填充。文章从数据间的关系入手 ,引入相似度的概念 ,并提出一种新的数据遗失值填充算法。这种算法简单 ,易于理解 ,可对一个数据具有多个遗失值的情况进行填充。
-
关键词
决策树
数据遗失值
填充方法
关联规则
相似度
数据库
-
Keywords
association rule
missing value
decision tree
similarity
filling
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名对一种新的决策树建立方法的研究
被引量:2
- 3
-
-
作者
郭景峰
米浦波
刘国华
-
机构
燕山大学计算机科学与工程系
-
出处
《计算机科学》
CSCD
北大核心
2002年第6期121-122,129,共3页
-
基金
河北省自然科学基金
项目号(600225)
-
文摘
1 决策树数据挖掘技术中的决策树技术是首先从机器学习领域得来的,它与关联规则技术作为数据挖掘技术的两个大方向,在许多领域都有广泛的应用,如:医学、地质学、天文学、物理学、金融领域等等,并发挥着巨大的作用。决策树技术能建立分类系统及产生预测系统。从训练样本集出发,它的建立是一个速归过程。它重复执行以下过程:根据评价标准选择数据中的某一属性作为分割标准,将当前节点(数据集)分割成子节点(数据子集),如果各个子节点中的数据属于同一类,以类名标注,过程结束,否则过程在包含不同类数据的子节点中进行。
-
关键词
数据挖掘
关联规则
决策树
机器学习
-
Keywords
Decision trees,Support confidence,Over-fitting,Pruning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-