基于决策边界的倾斜森林分类算法被引量：1

Oblique forests classification algorithm based on decision boundary

下载PDF

导出

摘要为进一步提高随机森林算法分类准确率,提出一种基于决策边界的倾斜森林(oblique forests based on decision boundary,OFDB)分类算法。将决策边界与自适应权重融入随机森林算法框架,采用决策边界作为分裂准则,使原本垂直于数据空间的分裂准则变为倾斜的超平面,有效提高算法对数据空间结构的适应能力。自适应权重改进叶子结点类标号计算方法,有效提高算法对不平衡数据的分类能力。实验结果表明,该算法与随机森林算法相比具有更高的分类准确率与较好的不平衡数据分类能力。 To improve the classification accuracy of random forest algorithm,the oblique forests algorithm based on decision boundary was proposed.Decision boundary and adaptive weights were combined with random forests framework.Decision boundary was used to replace the original splitting criterion which was perpendicular to the data space,which effectively improved the algorithm’s ability to adapt to the data space structure.Adaptive weights were used to improve the calculation method of leaf node class labels,which effectively improved the algorithm’s ability to classify imbalanced data.Experimental results indicate that the classification accuracy and imbalanced data classification ability of this algorithm are better than that of random forests algorithm.

作者阚学达桂琼张攀峰 KAN Xue-da;GUI Qiong;ZHANG Pan-feng(College of Information Science and Engineering,Guilin University of Technology,Guilin 541004,China)

机构地区桂林理工大学信息科学与工程学院

出处《计算机工程与设计》北大核心 2022年第2期391-398,共8页 Computer Engineering and Design

基金国家自然科学基金项目(61862019) 广西自然科学基金项目(2017GXNSFAA198223) 广西科技基地和人才专项基金项目(2018AD19136) 桂林理工大学科研启动基金项目(GLUTQD2017065)。

关键词分类随机森林逻辑回归分裂准则决策边界 classification random forests logistic regression splitting criterion decision boundary

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1吴潇雨,和敬涵,张沛,胡骏.基于灰色投影改进随机森林算法的电力系统短期负荷预测[J].电力系统自动化,2015,39(12):50-55. 被引量：177
2赵腾,王林童,张焰,田世明.采用互信息与随机森林算法的用户用电关联因素辨识及用电量预测方法[J].中国电机工程学报,2016,36(3):604-614. 被引量：95
3任家东,刘新倩,王倩,何海涛,赵小林.基于KNN离群点检测和随机森林的多层入侵检测方法[J].计算机研究与发展,2019,56(3):566-575. 被引量：72
4黄良韬,赵志诚,赵亚群.基于随机森林的密码体制分层识别方案[J].计算机学报,2018,41(2):382-399. 被引量：24
5马超,刘亚淑,骆功宁,王宽全.基于级联随机森林与活动轮廓的3D MR图像分割[J].自动化学报,2019,45(5):1004-1014. 被引量：8
6史金余,杨泽宇,谢兄.基于模糊决策的随机森林算法[J].计算机工程与设计,2020,41(8):2207-2212. 被引量：13
7丁家满,王思晨,贾连印,游进国,姜瑛.Spark环境下基于综合权重的不平衡数据集成分类方法[J].小型微型计算机系统,2019,40(2):255-259. 被引量：7
8胡小生,温菊屏,钟勇.动态平衡采样的不平衡数据集成分类方法[J].智能系统学报,2016,11(2):257-263. 被引量：13
9魏正韬,杨有龙,白婧.基于非平衡数据的随机森林分类算法改进[J].重庆大学学报（自然科学版）,2018,41(4):54-62. 被引量：11
10李慧,李正,佘堃.一种基于综合不放回抽样的随机森林算法改进[J].计算机工程与科学,2015,37(7):1233-1238. 被引量：14

二级参考文献104

1闫明松,周志华.代价敏感分类算法的实验比较[J].模式识别与人工智能,2005,18(5):628-635. 被引量：14
2朱陶业,李应求,张颖,张学庄,何朝阳.提高时间序列气象适应性的短期电力负荷预测算法[J].中国电机工程学报,2006,26(23):14-19. 被引量：45
3牛琨,张舒博,陈俊亮.采用属性聚类的高维子空间聚类算法[J].北京邮电大学学报,2007,30(3):1-5. 被引量：13
4中华人民共和国国家质量监督检验检疫总局.GB/T4754-2011国民经济行业分类[s].北京:中国标准出版社,2011.
5Breiman L. Random forests[J]. Machine Learning, 2001,45, 5-32.
6Kulkarni V Y, Sinha P K. Efficient learning of random forest classifier using disjoint partitioning approach[C]//Proc of the World Congress on Engineering, 2013 : 3-5.
7Kulkarni V Y, Sinha P K. Random forest classifiers.. A sur- vey and future research directions[J]. International Journal of Advanced Computing,2011,36(1) :1144-1153.
8Buja A, Stuetzle W. Bagging does not always decrease mean squared error[R]. NJ ATT Labs-Research, 2012.
9Oshiro T M, Perez P S, Baranauskas J A. How many trees in a random forest[C]//Proc of MLDM'12, 2012:154-168.
10IA Yu,Zhang Chun-xia. Based on a random sample out_of_ bag over forest parameter estimation algorithm[J]. Journal of Systems Engineering,2011,26(4) :566-572. (in Chinese).

共引文献537

1罗澍忻,麻敏华,蒋林,靳冰洁,林勇,刁旭昊,黎灿兵,杨波.考虑多时间尺度数据的中长期负荷预测方法[J].中国电机工程学报,2020,40(S01):11-19. 被引量：36
2李兵,韩睿,何怡刚,张晓艺,侯金波.改进随机森林算法在电机轴承故障诊断中的应用[J].中国电机工程学报,2020,40(4):1310-1319. 被引量：71
3周传华,徐文倩,朱俊杰.基于代价敏感卷积神经网络的集成分类算法[J].应用科学学报,2022,40(1):69-79. 被引量：5
4梁宏涛,刘红菊,李静,王莹,郭超男.基于机器学习的短期负荷预测算法综述[J].计算机系统应用,2022,31(10):25-35. 被引量：9
5李村合,姜宇,李帅.基于不等距超平面距离的模糊支持向量机[J].计算机系统应用,2020(10):185-191. 被引量：6
6池亚平,岳梓岩,赵伦.密码算法识别技术研究进展与展望[J].北京电子科技学院学报,2022,30(4):1-14.
7王徐来,向广利,李蓓蕾,李祯鹏,张涛.基于组合随机性特征的哈希函数识别方案[J].武汉大学学报（理学版）,2023,69(2):215-222. 被引量：1
8徐超,雷锦涛,陈勇.一种基于LSTM-Blacklist的动态信任度证明机制[J].武汉大学学报（理学版）,2023,69(2):156-168.
9张超群,韦川源,梁刚,黑小龙,朱旭东.基于深度学习技术的恶意攻击的分析与识别[J].计算机应用研究,2020,37(S01):283-286. 被引量：6
10张丽颖,杨若瑾.基于机器学习的个人贷款违约预测模型的应用研究[J].金融监管研究,2022(6):46-59. 被引量：4

同被引文献17

1王春林,周昊,李国能,邱坤赞,岑可法.基于支持向量机与遗传算法的灰熔点预测[J].中国电机工程学报,2007,27(8):11-15. 被引量：42
2易静,苏新良,王润华.决策树在乳腺癌高位淋巴结转移判别诊断中的应用[J].重庆医科大学学报,2009,34(5):606-609. 被引量：7
3许洁,刘霞,李德侠,周志杰,王辅臣,于广锁.煤灰流动温度预测模型的研究[J].燃料化学学报,2012,40(12):1415-1421. 被引量：14
4张小艳,李婷,魏本龙.气化用煤配煤专家系统的研究[J].煤炭技术,2017,36(3):240-242. 被引量：5
5张元鸣,陈苗,陆佳炜,徐俊,肖刚.基于MapReduce的Bagging决策树优化算法[J].计算机工程与科学,2017,39(5):841-848. 被引量：8
6何建国,秦云虎,王双美,张静,马荣,朱士飞,杨柳.神府矿区5^(-2)煤层煤质特征及其气/液化性能评价[J].煤炭科学技术,2018,46(10):228-234. 被引量：16
7张渤,张洪,杨云飞,胡光洲,张鹏启,伦飞.晋城煤粒度变化对灰熔融性影响规律研究[J].燃料化学学报,2018,46(12):1430-1436. 被引量：4
8张忠林,吴挡平.基于概率阈值Bagging算法的不平衡数据分类方法[J].计算机工程与科学,2019,41(6):1086-1094. 被引量：14
9张昀朋,丁华,白向飞.神东矿区高硅铝比煤灰黏温特性研究[J].煤炭科学技术,2021,49(4):244-250. 被引量：7
10秦国兰.基于决策树CHAID算法的工程项目成本控制风险细分实证研究[J].项目管理技术,2021,19(8):136-140. 被引量：3

引证文献1

1张挺,李寒旭,张晔,陈和荆.基于Bagging集成CHAID决策树算法的神东矿区煤灰熔融温度预测[J].广州化工,2022,50(14):179-183. 被引量：1

二级引证文献1

1陈晓龙.煤灰熔融性温度影响因素及调控研究进展[J].煤化工,2023,51(5):53-55.

1卢菁,王菊钿,刘丛.融合多特征的跨社交网络用户在线识别方法研究[J].小型微型计算机系统,2021,42(11):2407-2414. 被引量：1
2张卓,白健.欺骗诱捕平台系统架构及其关键技术研究[J].信息技术,2022,46(2):151-155.
3沫儿.小苹果的奇妙之旅[J].动漫界（幼教365）,2022(9):36-36.
4李懿恒,杜晨曦,杨燕燕,李翔宇.基于伪标签一致度的不平衡数据特征选择算法[J].计算机应用,2022,42(2):475-484. 被引量：2
5周尔昊,高尚,申震.基于旋转平衡森林的不平衡数据分类算法[J].计算机工程与设计,2022,43(2):458-464. 被引量：2
6居雨昂,于涵,严丹妮.农户金融能力对融资行为的影响研究——以江苏连云港市为例[J].中国市场,2022(5):44-46.
7吕勤学,郭杜杜,李心,赵亮.基于优化随机森林算法的浮动车GPS数据插补模型[J].科学技术与工程,2022,22(4):1656-1661. 被引量：8
8薛亮.基于IFA的二维最大熵图像分割算法研究[J].成都工业学院学报,2021,24(4):67-72. 被引量：1
9任行达,梁璐,李喜阳,王中齐,杨钰青,刘向东.机器学习预测母猪断奶仔猪数[J].中国畜牧杂志,2022,58(2):254-259.
10王玮,庞婷婷.基于数据挖掘的城市轨道交通信息安全检测[J].微型电脑应用,2022,38(2):113-115. 被引量：4

计算机工程与设计

2022年第2期

浏览历史

内容加载中请稍等...

基于决策边界的倾斜森林分类算法被引量：1

参考文献14

二级参考文献104

共引文献537

同被引文献17

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于决策边界的倾斜森林分类算法 被引量：1

参考文献14

二级参考文献104

共引文献537

同被引文献17

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于决策边界的倾斜森林分类算法被引量：1