期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于规则集划分的多决策树报文分类算法 被引量:5
1
作者 马腾 陈庶樵 +1 位作者 张校辉 田乐 《计算机应用》 CSCD 北大核心 2013年第9期2450-2454,共5页
为克服决策树算法处理高速网络、大容量规则集下的报文分类问题时内存使用量大的弊端,提出一种基于规则集划分的多决策树报文分类算法。在保证规则子集数量可控的前提下,采用启发式算法将规则集划分为有限个规则子集,最大限度分离交叠规... 为克服决策树算法处理高速网络、大容量规则集下的报文分类问题时内存使用量大的弊端,提出一种基于规则集划分的多决策树报文分类算法。在保证规则子集数量可控的前提下,采用启发式算法将规则集划分为有限个规则子集,最大限度分离交叠规则;提出两级级联决策树结构,降低决策树深度以减少规则查找时间。理论分析表明,该算法空间复杂度较传统单决策树算法大幅降低。仿真结果表明,该算法的内存使用量比目前空间性能最好的EffiCuts算法减少了30%,且维度可扩展性更好。 展开更多
关键词 报文分类 规则集划分 多决策树 内存使用量 大容量规则集
下载PDF
基于多决策树的RFID入侵检测模型
2
作者 杨晓明 丁哲 +1 位作者 秦志光 王佳昊 《计算机应用研究》 CSCD 北大核心 2014年第4期1172-1175,共4页
为了能够有效对RFID系统的已知攻击和未知攻击进行检测和预警,在分析大量RFID安全协议的基础上,提出了利用构建多决策树的方法对RFID系统的入侵行为进行检测。通过分析,得到所构造出的多决策树能够发现针对RFID系统的攻击之间的关系,并... 为了能够有效对RFID系统的已知攻击和未知攻击进行检测和预警,在分析大量RFID安全协议的基础上,提出了利用构建多决策树的方法对RFID系统的入侵行为进行检测。通过分析,得到所构造出的多决策树能够发现针对RFID系统的攻击之间的关系,并且具有可扩展性和高效性,使之能够适用于各种实际的RFID系统的应用。 展开更多
关键词 RFID 安全隐患 入侵检测 安全协议 多决策树
下载PDF
基于加权多决策树的入侵检测系统模型研究 被引量:1
3
作者 向昕彦 张凤斌 《计算机安全》 2009年第8期12-14,共3页
传统的决策树分类方法,对于较小的数据集是非常有效的。但是,当这些方法用于入侵检测系统中时,由于巨大的网络流量,因此,存在着检测性能低和数据挖掘效率不高等问题。为了解决这些问题,提出了加权多决策树模型。将这种方法应用于入侵检... 传统的决策树分类方法,对于较小的数据集是非常有效的。但是,当这些方法用于入侵检测系统中时,由于巨大的网络流量,因此,存在着检测性能低和数据挖掘效率不高等问题。为了解决这些问题,提出了加权多决策树模型。将这种方法应用于入侵检测系统中,实验结果表明,该方法提高了入侵检测性能和大容量数据的处理能力。 展开更多
关键词 多决策树 入侵检测系统 数据挖掘
下载PDF
基于代价敏感混合分裂策略的多决策树算法 被引量:6
4
作者 张翕茜 李凤莲 +1 位作者 张雪英 田玉楚 《电子技术应用》 北大核心 2017年第10期128-131,136,共5页
煤矿瓦斯预警可视为是否安全的分类问题,数据呈现不平衡分布特点。为此,提出一种混合策略属性选择多决策树分类算法:算法融合代价敏感因子,结合C4.5和CART属性选择方法作为分裂指标,并采用了基于不同根节点信息的多决策树建树方法。首... 煤矿瓦斯预警可视为是否安全的分类问题,数据呈现不平衡分布特点。为此,提出一种混合策略属性选择多决策树分类算法:算法融合代价敏感因子,结合C4.5和CART属性选择方法作为分裂指标,并采用了基于不同根节点信息的多决策树建树方法。首先采用11个非平衡数据集进行算法有效性验证,实验结果表明,该方法可以有效针对不平衡数据进行分类,保证高准确率的前提下,有效提高了少数类预测准确性;进而将该算法用于煤矿瓦斯数据预测,结果表明,所提出方法可以有效提高煤矿瓦斯数据的总体预测性能。 展开更多
关键词 不平衡数据 代价敏感 混合属性 多决策树 煤矿瓦斯预警
下载PDF
一种面向不平衡分类的改进多决策树算法 被引量:6
5
作者 段化娟 尉永清 +1 位作者 刘培玉 周鹏 《广西师范大学学报(自然科学版)》 CAS 北大核心 2020年第2期72-80,共9页
在处理不平衡数据集时,为了降低类重叠对分类效果的影响,避免过采样造成的过拟合现象,以及欠采样造成的信息丢失问题,本文提出一种基于欠采样与属性选择的多决策树方法UAMDT(multi-decision tree based on under-sampling and attribute... 在处理不平衡数据集时,为了降低类重叠对分类效果的影响,避免过采样造成的过拟合现象,以及欠采样造成的信息丢失问题,本文提出一种基于欠采样与属性选择的多决策树方法UAMDT(multi-decision tree based on under-sampling and attribute selection)。其首先利用Tomek link欠采样与集成欠采样两种技术相结合对数据进行处理,并获得多个平衡子集;然后在每个平衡子集上构建单决策树,采用结合信息增益和基尼指数的混合属性度量作为属性选择标准,选择最优属性作为每棵单决策树的根节点的分裂属性;最后将单决策树进行集成构建多决策树。通过对10个不平衡数据集的多个评估指标进行实验,验证了本文算法的有效性和可行性。 展开更多
关键词 不平衡数据 多决策树 Tomek link欠采样 集成欠采样 属性选择
下载PDF
基于代价敏感理论的多决策树煤层底板突水预测模型 被引量:4
6
作者 李彦民 周晨阳 李凤莲 《工矿自动化》 北大核心 2020年第12期76-83,共8页
在进行煤层底板突水预测时,水害状况一般分为安全和突水2种状态,状态数据具有非平衡特点,而已有的煤层底板突水预测模型主要适用于平衡数据,对非平衡数据集预测结果常呈现"一边倒"现象,即安全状况的预测准确率明显高于突水状... 在进行煤层底板突水预测时,水害状况一般分为安全和突水2种状态,状态数据具有非平衡特点,而已有的煤层底板突水预测模型主要适用于平衡数据,对非平衡数据集预测结果常呈现"一边倒"现象,即安全状况的预测准确率明显高于突水状况的预测准确率,整体预测性能较低。针对该问题,构建了基于代价敏感理论的多决策树煤层底板突水预测模型。该模型中,每个决策树选用不同的突水影响因素作为单决策树的根节点,单决策树节点属性选择准则融合代价敏感理论及Gini指标,从而加重了对突水数据(少数类)误判的惩罚力度,提高了突水状况的预测性能;根据构建的单决策树突水预测模型得到其规则集,将所有单决策树突水预测模型规则集合并,得到多决策树突水预测模型规则集,采用多决策树突水预测模型规则集得到多个突水数据的预测结果,而后采用少数服从多数原则,基于投票法得到最终的预测结果。实验结果表明:该模型随着惩罚因子的增大,真实正类率预测结果呈现先增后减的趋势;与基于分类回归树(CART)算法的单决策树突水预测模型相比较,在数据不平衡率为2、分类错误惩罚因子取4时,该模型真实正类率可达到93.06%,真实负类率可达到97.85%,准确率为96.25%,均优于基于CART算法的突水预测模型性能;在数据不平衡率提高到6、分类错误惩罚因子取20时,2种模型的正类率均达到100%,本文模型的负类率为99.37%,准确率为99.47%,依然优于基于CART算法的突水预测模型性能。实验结果验证了本文模型的有效性。 展开更多
关键词 煤层底板突水预测 突水影响因素 非平衡数据集 代价敏感理论 多决策树
下载PDF
同分布强化学习优化多决策树及其在非平衡数据集中的应用 被引量:2
7
作者 焦江丽 张雪英 +1 位作者 李凤莲 牛壮 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第5期1112-1118,共7页
针对传统决策树在非平衡数据集分类时少数类预测性能出现偏差的问题,提出一种基于强化学习累积回报的属性优化策略即改进型同分布多决策树方法。首先通过同分布随机抽样法对非平衡数据集中的多数类样本进行随机采样,进而对各子集建立单... 针对传统决策树在非平衡数据集分类时少数类预测性能出现偏差的问题,提出一种基于强化学习累积回报的属性优化策略即改进型同分布多决策树方法。首先通过同分布随机抽样法对非平衡数据集中的多数类样本进行随机采样,进而对各子集建立单决策树形成多个决策树,各决策树采用分类回归树算法建树,并利用强化学习累积回报机制进行属性选择策略的优化。研究结果表明:提出的基于强化学习累积回报机制的属性优化策略可有效提高少数类被正确分类的概率;同分布多决策树方法可有效提高非平衡数据集整体预测性能,且正类率和负类率的几何平均值都有所提高。 展开更多
关键词 非平衡数据集 多决策树 累积回报机制属性选择策略 同分布随机抽样 强化学习
下载PDF
改进欠抽样方法及其在非平衡数据集分类中的应用 被引量:7
8
作者 牛壮 李凤莲 +2 位作者 张雪英 樊宇宙 魏鑫 《计算机工程》 CAS CSCD 北大核心 2019年第6期218-224,共7页
欠抽样方法在非平衡数据集分类时,未充分考虑数据分布变化对分类结果造成的影响。为此,提出一种基于聚类融合去冗余的改进欠抽样方法。采用聚类算法得到多数类样本高密度分布区域的聚类中心,将多数类样本划分为不同子集,通过计算各子集... 欠抽样方法在非平衡数据集分类时,未充分考虑数据分布变化对分类结果造成的影响。为此,提出一种基于聚类融合去冗余的改进欠抽样方法。采用聚类算法得到多数类样本高密度分布区域的聚类中心,将多数类样本划分为不同子集,通过计算各子集的相似度冗余系数对多数类样本进行去冗余删除,以达到欠抽样的目的。对15个不同平衡率的数据集欠抽样后,利用代价敏感混合属性多决策树模型进行分类。实验结果表明,在不降低非平衡数据集分类准确率的前提下,该方法能够提高少数类样本的正类率及预测模型的G-mean值。 展开更多
关键词 非平衡数据集 聚类算法 欠抽样 去冗余 多决策树预测模型
下载PDF
Rotation forest based on multimodal genetic algorithm 被引量:2
9
作者 XU Zhe NI Wei-chen JI Yue-hui 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1747-1764,共18页
In machine learning,randomness is a crucial factor in the success of ensemble learning,and it can be injected into tree-based ensembles by rotating the feature space.However,it is a common practice to rotate the featu... In machine learning,randomness is a crucial factor in the success of ensemble learning,and it can be injected into tree-based ensembles by rotating the feature space.However,it is a common practice to rotate the feature space randomly.Thus,a large number of trees are required to ensure the performance of the ensemble model.This random rotation method is theoretically feasible,but it requires massive computing resources,potentially restricting its applications.A multimodal genetic algorithm based rotation forest(MGARF)algorithm is proposed in this paper to solve this problem.It is a tree-based ensemble learning algorithm for classification,taking advantage of the characteristic of trees to inject randomness by feature rotation.However,this algorithm attempts to select a subset of more diverse and accurate base learners using the multimodal optimization method.The classification accuracy of the proposed MGARF algorithm was evaluated by comparing it with the original random forest and random rotation ensemble methods on 23 UCI classification datasets.Experimental results show that the MGARF method outperforms the other methods,and the number of base learners in MGARF models is much fewer. 展开更多
关键词 ensemble learning decision tree multimodal optimization genetic algorithm
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部