-
题名基于信息熵和几何轮廓相似度的多变量决策树
被引量:1
- 1
-
-
作者
张宇
包研科
邵良杉
-
机构
辽宁工程技术大学理学院
辽宁工程技术大学系统工程研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2018年第4期1018-1022,共5页
-
基金
国家自然科学基金资助项目(71371091)
-
文摘
现有的多变量决策树在分类准确性与树结构复杂性两方面优于单变量决策树,但其训练时间却高于单变量决策树,使得现有的多变量决策树不适用于快速响应的分类任务。针对现有多变量决策树训练时间高的问题,提出了基于信息熵和几何轮廓相似度的多变量决策树(IEMDT)。该算法利用几何轮廓相似度函数的一对一映射特性,将n维空间样本点投影到一维空间的数轴上,进而形成有序的投影点集合;然后通过类别边界和信息增益计算最优分割点集,将有序投影点集合划分为多个子集;接着分别对每个子集继续投影分割,最终生成决策树。在八个数据集上的实验结果表明,IEMDT具有较低的训练时间,并且具有较高的分类准确性。
-
关键词
多变量决策树
分类
单变量决策树
几何轮廓相似度
信息增益
-
Keywords
multivariate decision tree
classification
univariate decision tree
outline similarity
information gain
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于轮廓相似度的土壤肥力时空变异性判别
- 2
-
-
作者
黄静
吴祥云
包研科
赵凤华
-
机构
辽宁工程技术大学理学院
辽宁工程技术大学环境科学与工程学院
-
出处
《生物数学学报》
2013年第4期681-689,共9页
-
基金
水体污染控制与治理科技重大专项课题2012ZX 0720202008-001
-
文摘
采用几何轮廓相似度模型,分别对彰武县境内柳河流域所辖乡村1985年与2009年土壤肥力等级进行判别.结果表明:研究区所辖43个乡村土壤肥力普遍处于中下等水平;与1985年相比,2009年有15个乡村土壤肥力级别降低即土壤肥力变差,9个乡村土壤肥力级别升高即土壤肥力变好,19个乡村土壤肥力级别未发生变化.该模型可在缺乏多标度数据分布信息或小样本条件下难以估计统计特征的应用问题中,通过分析多标度数据的几何特征对数据进行判别;且模型采用了凹函数求平均值,从而减小了一些突变型数据对判别的干扰.因此,采用几何轮廓相似度模型判别土壤肥力时空变异性准确且简便可行.
-
关键词
柳河流域
土壤肥力
几何轮廓相似度
-
Keywords
Liuhe basin
Soil fertility
Geometric contour similarity
-
分类号
S158.5
[农业科学—土壤学]
-
-
题名面向分布式数据流大数据分类的多变量决策树
被引量:17
- 3
-
-
作者
张宇
包研科
邵良杉
刘威
-
机构
辽宁工程技术大学理学院
辽宁工程技术大学系统工程研究所
-
出处
《自动化学报》
EI
CSCD
北大核心
2018年第6期1115-1127,共13页
-
基金
国家自然科学基金(71371091)资助~~
-
文摘
分布式数据流大数据中的类别边界不规则且易变,因此基于单变量决策树的集成分类器需要较大数量的基分类器才能准确地近似表达类别边界,这将降低集成分类器的学习与分类性能.因而,本文提出了基于几何轮廓相似度的多变量决策树.在最优基准向量的引导下将n维空间样本点投影到一维空间以建立有序投影点集合,然后通过类别投影边界将有序投影点集合划分为多个子集,接着分别对不同类别集合的交集递归投影分裂,最终生成决策树.实验表明,本文提出的多变量决策树GODT具有很高的分类精度和较低的训练时间,有效结合了单变量决策树学习效率高与多变量决策树表示能力强的优点.
-
关键词
分布式数据流
大数据
分类
几何轮廓相似度
多变量决策树
-
Keywords
Distributed data streams
big data
classification
outline similarity
multivariate decision tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-