基于节点匹配代价优化的随机森林算法被引量：4

Optimization of random forest algorithm based on nodes matching cost

下载PDF

导出

摘要为提高随机森林算法的分类精度,在分析影响随机森林算法分类精度的几个要素后,针对随机森林中决策树的多样性,提出基于计算节点匹配代价的方法对随机森林算法进行优化。通过对比随机森林中所有决策树的分支点和分支点属性,利用匈牙利算法计算出两个决策树节点间最高匹配代价,建立决策树间的相似度矩阵。在相似度矩阵的基础上,通过谱聚类算法对决策树进行聚类分析,保留每类决策树中Kappa系数最高的决策树构建新的随机森林,依据其自身的Kappa系数对判决结果进行加权处理。实验结果表明,聚类加权优化后的随机森林算法的分类精度优于传统的随机森林算法。 To improve the classification accuracy of random forest algorithm,after analyzing several factors affecting the classi-fication accuracy of random forest algorithm,a method based on computational node matching cost was proposed to optimize the random forest algorithm.The branch point and branch point attributes of all decision trees in the random forest were compared,and the highest matching cost between the two decision tree nodes was calculated using the Hungarian algorithm to establish the similarity matrix of the decision tree.Based on the similarity matrix,the decision tree was clustered using spectral clustering algorithm.The decision tree with the highest Kappa coefficient in each decision tree was constructed to construct a new random forest,and the decision result was weighted according to its own Kappa coefficient.Experimental results show that the classification accuracy of the clustering weighted random forest algorithm is better than that of the traditional random forest algorithm.

作者朱瑛谢睿郑若池 ZHU Ying;XIE Rui;ZHENG Ruo-chi(School of Mechanics Engineering,Shenyang Aerospace University,Shenyang 110136,China)

机构地区沈阳航空航天大学机电工程学院

出处《计算机工程与设计》北大核心 2020年第11期3106-3111,共6页 Computer Engineering and Design

基金国家重点实验室基金项目(SKLRS-2013-MS-04)。

关键词随机森林决策树匈牙利算法谱聚类 Kappa系数聚类优化 random forest decision tree Hungary algorithm spectral clustering Kappa coefficient clustering optimization

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1王日升,谢红薇,安建成.基于分类精度和相关性的随机森林算法改进[J].科学技术与工程,2017,17(20):67-72. 被引量：14
2薛铭龙,李一博.基于改进随机森林算法的智能环境活动识别[J].计算机工程,2019,45(5):149-154. 被引量：6
3张亮,宁芊.CART决策树的两种改进及应用[J].计算机工程与设计,2015,36(5):1209-1213. 被引量：57
4王诚,王凯.一种基于聚类约简决策树的改进随机森林算法[J].南京邮电大学学报（自然科学版）,2019,39(3):91-97. 被引量：20
5关晓蔷,庞继芳,梁吉业.基于类别随机化的随机森林算法[J].计算机科学,2019,46(2):196-201. 被引量：15
6吴玉强,田素诚.基于代价敏感鉴别字典学习的入侵检测方法[J].科技通报,2017,33(12):162-166. 被引量：3
7李晓慧,王宏,李晓兵,迟登凯,汤曾伟,韩重远.基于多时相Landsat 8 OLI影像的农作物遥感分类研究[J].遥感技术与应用,2019,34(2):389-397. 被引量：33
8张华忠,侯进.基于决策树C4.5集成算法的图像自动标注[J].计算机应用研究,2018,35(7):2222-2224. 被引量：9

二级参考文献36

1蔡耀君,华璀,卢远.峰丛洼地农作物面向对象信息提取规则集[J].遥感信息,2015,30(3):104-110. 被引量：4
2赵敏,陈恩红,宋睿.基于集成学习的Adaboost演化决策树算法[J].计算机应用与软件,2007,24(3):1-2. 被引量：4
3邵峰晶,于忠清,王金龙,孙仁诚.数据挖掘原理与算法[M].第二版.北京:科学出版社.2009:90-92.
4乔增伟,孙卫祥.C4.5算法的两点改进[J].江苏工业学院学报,2008,20(4):56-59. 被引量：10
5张竞成,李建元,杨贵军,黄文江,罗菊花,王纪华.基于光谱知识库的TM影像冬小麦条锈病监测研究[J].光谱学与光谱分析,2010,30(6):1579-1585. 被引量：8
6李如平.数据挖掘中决策树分类算法的研究[J].东华理工大学学报（自然科学版）,2010,33(2):192-196. 被引量：28
7陈燕丽,莫伟华,莫建飞,王君华,钟仕全.基于面向对象分类的南方水稻种植面积提取方法[J].遥感技术与应用,2011,26(2):163-168. 被引量：48
8吕晓艳,刘春煌,朱建生.基于关键度度量的决策树算法改进及其在铁路运输中的应用[J].铁道学报,2011,33(9):62-67. 被引量：1
9陈辉林,夏道勋.基于CART决策树数据挖掘算法的应用研究[J].煤炭技术,2011,30(10):164-166. 被引量：36
10魏晗,李弼程,张瑞杰,唐永旺.图像语义提取方法研究[J].现代电子技术,2011,34(24):103-106. 被引量：6

共引文献144

1赵会芹,于博,陈方,王雷.基于高分辨率卫星遥感影像滑坡提取方法研究现状[J].遥感技术与应用,2023,38(1):108-115. 被引量：2
2赵晋陵,詹媛媛,王娟,黄林生.基于SE-UNet的冬小麦种植区域提取方法[J].农业机械学报,2022,53(9):189-196. 被引量：10
3吴冬,阎卫东,王井利.基于特征重要性加权的随机森林点云分类研究[J].电子测量技术,2023,46(20):120-127. 被引量：1
4史楠,韩丽娜,李振兴.基于CART决策树算法的犯罪类型决策研究[J].智能计算机与应用,2020,10(7):155-157. 被引量：3
5李跃,李纶.鲜切花的保鲜包装技术研究初探[J].中国包装,2000,20(3):47-50. 被引量：8
6胡淼,王开军,李海超,陈黎飞.模糊树节点的随机森林与异常点检测[J].南京大学学报（自然科学版）,2018,54(6):1141-1151. 被引量：4
7仝茵,刘丽.基于Ada Boost的核素识别方法[J].中国电子科学研究院学报,2019,14(1):101-106. 被引量：1
8姚程宽,光峰,卢灿举,曹立勇,詹喆.数据挖掘经典算法研究[J].广州航海学院学报,2016,24(3):47-49.
9邹辉,吴奇峰,张一飞,明德烈.基于决策树的景象匹配算法性能评估方法研究[J].计算机与数字工程,2016,44(11):2103-2109. 被引量：1
10赵健赟,彭军还.基于GMM与图像多元特征的自动决策树分类方法研究[J].内蒙古师范大学学报（自然科学汉文版）,2016,45(5):709-715.

同被引文献47

1徐林明,李美娟.动态综合评价中的数据预处理方法研究[J].中国管理科学,2020,0(1):162-169. 被引量：53
2钟小强,陈杰,蒋敏敏,郑晓晖.基于深度学习的台区线损分析方法[J].电网技术,2020,44(2):769-774. 被引量：50
3孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：619
4唐华承,闫明慧,刘幺和.基于移动终端的ERP财务管理模块数据分析及处理[J].湖北工业大学学报,2016,31(4):41-44. 被引量：3
5马超.引力搜索优化ELM的企业财务危机预警方法[J].计算机应用研究,2017,34(7):2049-2054. 被引量：1
6黄良韬,赵志诚,赵亚群.基于随机森林的密码体制分层识别方案[J].计算机学报,2018,41(2):382-399. 被引量：26
7王鑫,吴际,刘超,杨海燕,杜艳丽,牛文生.基于LSTM循环神经网络的故障时间序列预测[J].北京航空航天大学学报,2018,44(4):772-784. 被引量：339
8胡鸿翔,梁锦,温广辉,虞文武.多智能体系统的群集行为研究综述[J].南京信息工程大学学报（自然科学版）,2018,10(4):415-421. 被引量：10
9徐东,王岩俊,孟宇龙,张子迎.基于Isolation Forest改进的数据异常检测方法[J].计算机科学,2018,45(10):155-159. 被引量：24
10杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(A02):1-6. 被引量：389

引证文献4

1冯华伟.基于深度神经网络的异常财务数据识别方法[J].电子设计工程,2022,30(10):31-35. 被引量：6
2常鸿,李威武,马喜平,杨军亭,董晓阳.考虑温度-负荷相关性的低压台区线损估算方法[J].电气技术与经济,2022(6):58-61. 被引量：1
3朱丽丽.随机森林算法下列表级排序学习推荐系统设计[J].淮阴工学院学报,2023,32(5):62-68.
4朱静,宋素素.基于强化学习的随机森林困难等级分类算法[J].无线互联科技,2024,21(14):109-113.

二级引证文献7

1刘柯倩.基于大数据和卷积神经网络的财务数据异常告警方法[J].信息与电脑,2023,35(15):52-54. 被引量：1
2高溪,王良浩.基于SVM主动学习的制革企业财务管理数据分类方法[J].皮革与化工,2023,40(6):17-22.
3何远景,李光龙.基于LLM的金融市场波动率高频数据异常检测方法[J].常熟理工学院学报,2024,38(2):89-94.
4宁昭义,许国宏,王耀磊.基于深度学习的互联网接收机中特定信号识别[J].电子技术应用,2024,50(5):66-70.
5周伟.基于随机森林算法的企业财务数据风险预警方法[J].新乡学院学报,2024,41(6):28-33.
6荣锦.基于计算机通信的低压台区线损智能诊断方法[J].通信电源技术,2024,41(18):124-126.
7王斓斐,杨怡雯.基于BP神经网络的财务软件自动化控制系统设计[J].电子设计工程,2024,32(20):163-167.

1杨思明,王凤军.遗传算法与分枝定界法求解TSP研究[J].计算机科学与应用,2020,10(9):1609-1617. 被引量：1
2包永钢.基于图文法的城市道路匹配方法[J].地理信息世界,2020,27(5):102-107.
3王毅然,经小川,贾福凯,孙宇健,佟轶.基于多智能体协同强化学习的多目标追踪方法[J].计算机工程,2020,46(11):90-96. 被引量：7
4龙咏红.面向高光谱图像的高斯-稀疏子空间聚类算法[J].佛山科学技术学院学报（自然科学版）,2020,38(6):39-47.
5王川,金晓怡,陈志鹏,叶黎杰.6-DOF抛光工业机器人关节空间轨迹规划研究[J].机械设计与制造,2020(11):271-274. 被引量：15
6江冀海,王玉辉.融入动车组司机素质的铁道机车专业素质教育研究[J].南方农机,2020,51(21):172-173.
7陆焱,郭竞.基于Curvelet变换的高频细节图像去噪算法[J].计算机仿真,2020,37(10):393-397. 被引量：2
8王萍.多元异构网络安全日志数据融合方法仿真[J].计算机仿真,2020,37(10):249-252. 被引量：1
9张维,骆忠强,熊兴中,谢伟.电力线中基于幂迭代ICA的脉冲噪声抑制方法研究[J].现代电子技术,2020,43(21):6-11. 被引量：2

计算机工程与设计

2020年第11期

浏览历史

内容加载中请稍等...

基于节点匹配代价优化的随机森林算法被引量：4

参考文献8

二级参考文献36

共引文献144

同被引文献47

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于节点匹配代价优化的随机森林算法 被引量：4

参考文献8

二级参考文献36

共引文献144

同被引文献47

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于节点匹配代价优化的随机森林算法被引量：4