-
题名基于原型抽象和分类价值量的决策树算法
被引量:1
- 1
-
-
作者
周亮
晏立
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2010年第8期2899-2901,共3页
-
基金
国家自然科学基金资助项目(70971067)
国家科技型中小企业技术创新基金(09C26213203797)
-
文摘
为了克服现有决策树分类算法在大数据集上的有效性和可伸缩性的局限,提出一种新的基于粗糙集理论的决策树算法。首先提出基于代表性实例的原型抽象方法,该方法从原始数据集中抽取代表性实例组成抽象原型,可缩减实例数目和无关属性,从而使算法可以处理大数据集;然后提出属性分类价值量概念,并作为选择属性的启发式测度,该测度描述了属性对分类的贡献价值量的多少,侧重考虑了属性之间以及实例与分类之间的关系。实验表明,新算法比其他算法生成的决策树规模要小,准确率也有显著提高,在大数据集上尤为明显。
-
关键词
决策树
粗糙集
大数据集
代表性实例
原型抽象
属性分类价值量
-
Keywords
decision tree
rough set
large data sets
representative instance
abstraction archetype
classification value
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-