期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种懒惰式决策树和普通决策树结合的分类模型--半懒惰式决策树 被引量:1
1
作者 王建林 王志海 王学玲 《计算机应用与软件》 CSCD 北大核心 2008年第12期229-230,238,共3页
懒惰式决策树分类是一种非常有效的分类方法。它从概念上为每一个测试实例建立一棵"最优"的决策树。但是,大多数的研究是基于小的数据集合之上。在大的数据集合上,它的分类速度慢、内存消耗大、易被噪声误导等缺点,影响了其... 懒惰式决策树分类是一种非常有效的分类方法。它从概念上为每一个测试实例建立一棵"最优"的决策树。但是,大多数的研究是基于小的数据集合之上。在大的数据集合上,它的分类速度慢、内存消耗大、易被噪声误导等缺点,影响了其分类性能。通过分析懒惰式决策树和普通决策树的分类原则,提出了一种新的决策树分类模型,Semi-LDtree。它生成的决策树的节点,如普通决策树一样,包含单变量分裂,但是叶子节点相当于一个懒惰式决策树分类器。这种分类模型保留了普通决策树良好的可解释性,实验结果表明它提高了分类速度和分类精确度,在某些分类任务上它的分类性能经常性地胜过两者,特别是在大的数据集合上。 展开更多
关键词 懒惰式决策树 朴素贝叶斯 懒惰式决策树算机
下载PDF
一种基于Shapelets的懒惰式时间序列分类算法 被引量:9
2
作者 王志海 张伟 +1 位作者 原继东 刘海洋 《计算机学报》 EI CSCD 北大核心 2019年第1期29-43,共15页
近些年,时间序列分类问题研究受到了越来越多的关注.基于shapelets的时间序列分类技术是一种有效的方法.然而,其在提取最优shapelet的过程中要建立包含大量冗余元素的候选shapelets集合,一般所获得的shapelets只在平均意义上具有某种鉴... 近些年,时间序列分类问题研究受到了越来越多的关注.基于shapelets的时间序列分类技术是一种有效的方法.然而,其在提取最优shapelet的过程中要建立包含大量冗余元素的候选shapelets集合,一般所获得的shapelets只在平均意义上具有某种鉴别性;与此同时,普通模型往往忽略了待分类实例所具有的局部特征.为此,我们提出了一种依据待分类实例显著局部特征的懒惰式分类模型.这种模型为每个待分类实例构建各自的数据驱动的懒惰式shapelets分类模型,从而逐步缩小了与其分类相关的时间序列搜索空间,使得所获得的shapelets能够直接反映待分类实例的显著局部特征.实验结果表明该文提出的模型具有较高的准确率和更强的可解释性. 展开更多
关键词 时间序列 懒惰式学习 分类 shapelets 可解释性
下载PDF
基于K-近邻的局部懒惰式决策树分类模型 被引量:1
3
作者 卢润彩 庞超 时志素 《无线电工程》 2010年第2期57-60,共4页
分类是数据挖掘的一个重要研究课题,其概念是在已有数据的基础上构造出一个分类模型。该模型能够把数据库中的数据记录映射到给定类别中的某一个,从而进行数据的分类。通过对懒惰式学习策略的研究,在大量实验的基础之上,提出了一个新的... 分类是数据挖掘的一个重要研究课题,其概念是在已有数据的基础上构造出一个分类模型。该模型能够把数据库中的数据记录映射到给定类别中的某一个,从而进行数据的分类。通过对懒惰式学习策略的研究,在大量实验的基础之上,提出了一个新的分类模型——Local-LDtree。介绍了Local-LDtree模型的原理和算法,分析了其在分类精确度方面的优劣,指出了对其进行改进的方向。 展开更多
关键词 懒惰式学习策略 K-近邻算法 懒惰式决策树 Local-Ldtree
下载PDF
急切式和懒惰式学习策略相结合的决策树分类模型
4
作者 黄泽宇 卢润彩 《北京交通大学学报》 CAS CSCD 北大核心 2005年第5期92-97,共6页
急切式学习策略和懒惰式学习策略有着不同的学习和分类机制.通过分析急切式学习策略下的普通决策树模型和懒惰式学习策略下的懒惰式决策树模型,提出了一种新的决策树分类模型即Semi-LDtree.它生成的决策树的结点,如普通决策树一样,包含... 急切式学习策略和懒惰式学习策略有着不同的学习和分类机制.通过分析急切式学习策略下的普通决策树模型和懒惰式学习策略下的懒惰式决策树模型,提出了一种新的决策树分类模型即Semi-LDtree.它生成的决策树的结点,如普通决策树一样,包含单变量分裂,但是叶子结点相当于一个懒惰式决策树分类器.这种分类模型保留了普通决策树良好的可解释性,实验结果表明它提高了分类速度和分类精确度,特别是在大的数据集合上效果更加明显. 展开更多
关键词 急切学习策略 懒惰式学习策略 懒惰式决策树 朴素贝叶斯
下载PDF
一种基于数据流模式表示的半懒惰式分类算法
5
作者 江晶晶 王志海 原继东 《计算机科学》 CSCD 北大核心 2017年第7期167-174,202,共9页
依据从大规模数据中抽取的模式来建立分类模型是模式挖掘的重要研究问题之一。一种可行的方法是根据模式集合建立贝叶斯分类模型。然而,目前基于模式的贝叶斯分类模型大多是针对静态数据集合的,通常不能适应于高速动态变化与无限的数据... 依据从大规模数据中抽取的模式来建立分类模型是模式挖掘的重要研究问题之一。一种可行的方法是根据模式集合建立贝叶斯分类模型。然而,目前基于模式的贝叶斯分类模型大多是针对静态数据集合的,通常不能适应于高速动态变化与无限的数据流环境。对此,提出一种数据流环境下基于模式发现的贝叶斯分类学习模型,其采用半懒惰式学习策略,针对分类实例在不断更新的频繁项集合上建立局部的分类模型;为加快流数据处理的速度,提出了结构更为简单的混合树结构,同时提出了给定项限制的模式抽取机制以减少候选项集的生成;对数据流中模式抽取不完全的情况,使用平滑技术处理未被抽取的项。大量实验分析证明,相较于其他数据流分类器,所提模型具有更高的分类正确率。 展开更多
关键词 数据流 频繁模 贝叶斯 懒惰式学习
下载PDF
一种局部属性加权朴素贝叶斯分类算法 被引量:10
6
作者 张伟 王志海 +1 位作者 原继东 刘海洋 《北京交通大学学报》 CAS CSCD 北大核心 2018年第2期14-21,共8页
朴素贝叶斯模型具有的简单性和有效性,使其在诸多问题领域表现出优良的性能,但其属性条件独立性假设在实际应用中难以成立.而属性加权是降低属性条件独立性假设对分类器性能影响的主要途径.传统建立在整个数据集上的单一全局模型忽略了... 朴素贝叶斯模型具有的简单性和有效性,使其在诸多问题领域表现出优良的性能,但其属性条件独立性假设在实际应用中难以成立.而属性加权是降低属性条件独立性假设对分类器性能影响的主要途径.传统建立在整个数据集上的单一全局模型忽略了每个测试实例所具有的特点,同时从整个训练集上学习到的属性权重并不能准确反映每个属性对待分类实例的影响.为此提出一种基于数据驱动的懒惰式局部属性加权方法,它在每个测试实例的近邻集合上学习属性权重,并通过最优化方法建立相应的局部属性加权朴素贝叶斯模型.实验结果表明:和当前常见的准朴素贝叶斯模型相比,本文模型具有较高的分类准确率. 展开更多
关键词 朴素贝叶斯 懒惰式 属性加权 局部加权
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部