选择性集成算法分类与比较被引量：9

Categorization and Comparison of the Ensemble Pruning Algorithms

下载PDF

导出

摘要选择性集成是当前机器学习领域的研究热点之一。由于选择性集成属于NP"难"问题,人们多利用启发式方法将选择性集成转化为其他问题来求得近似最优解,因为各种算法的出发点和描述角度各不相同,现有的大量选择性集成算法显得繁杂而没有规律。为便于研究人员迅速了解和应用本领域的最新进展,本文根据选择过程中核心策略的特征将选择性集成算法分为四类,即迭代优化法、排名法、分簇法、模式挖掘法;然后利用UCI数据库的20个常用数据集,从预测性能、选择时间、结果集成分类器大小三个方面对这些典型算法进行了实验比较;最后总结了各类方法的优缺点,并展望了选择性集成的未来研究重点。 Ensemble pruning is an active research direction in the machine learning field.Ensemble pruning is an NP-hard problem,most researchers use heuristics to obtain near optimal solutions.There are already many ensemble pruning approaches in literatures,but because of the different perspectives on which those methods are based,it is difficult to understand them clearly.In this paper,the ensemble pruning approaches are divided into four categories according to their pruning strategies：optimization-based,ranking-based,clustering based and pattern mining-based.Next,the popular algorithms of each category are implemented and tested on 20 datasets from the UCI repository,and compared from three facets：prediction performance,pruning time and the size of the final ensembles.The advantages and disadvantages of each category are analyzed.The paper ends with some conclusions and future work.

作者赵强利蒋艳凰徐明

机构地区国防科学技术大学计算机学院

出处《计算机工程与科学》 CSCD 北大核心 2012年第2期134-138,共5页 Computer Engineering & Science

基金国家自然科学基金资助项目(60905032 60773017)

关键词集成学习选择性集成排名法分簇法迭代优化法模式挖掘法 ensemble learning ensemble pruning optimization based pruning ranking based pruning clustering based pruning pattern mining based pruning

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1Dietterich T. Machine Learning Research: Four Current Directions[J]. AI Magazine, 1997, 18(4):97-136.
2Zhou Z-H, Wu J, Tang W. Ensembling Neural Networks: Many Could Be Better Than All[J]. Artificial Intelligence, 2002, 137(1-2) :239-263.
3Caruana R, Niculescu-Mizil A, Crew G, et al. Ensemble Selection from Libraries of Models[C]//Proc of the 21st International Conference on Machine Learning, 2004.
4Martinez-Munoz G, Suarez A. Pruning in Ordered Bagging Ensembles[C]//Proc of the 23rd International Conference in Machine Learning, 2006 : 609-616.
5Martinez-Munoz G, Hernandez Lobato D, Suarez A. An Analysis of Ensemble Pruning Techniques Based on Ordered Aggregation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2), 245-259.
6Lazarevic A, Obradovic Z. The Effieetive Pruning of Neural Network Classifiers[C]//Proc of the 2001 IEEE/INNS In ternational Conference on Neural Networks, 2001:796 801.
7Zhao Q L, Jiang Y H, Xu M. A Fast Ensemble Pruning Algorithm Based on Pattern Mining [J]. Data Mining and Knowledge Discovery, 2009,19 (2) : 277-292.
8Dzeroski S,Zenko B. Is Combining Classifiers Better than Selecting the Best One[C]//Proc of the Nineteenth International Conference on Machine Learning, 2002:123-130.
9Breiman L. Bagging Predictors[J]. Machine Learning, 1996, 24(2) : 123-140.

同被引文献55

1林云光,陈月辉.基于集成学习的神经网络对小RNA的预测[J].济南大学学报（自然科学版）,2013,27(1):6-10. 被引量：2
2陈清华,郑涛,陈家伟.数制转换的本质和方法[J].江西师范大学学报（自然科学版）,2006,30(2):123-126. 被引量：11
3叶强,张洁.基于遗传算法的多分类器融合模型在信用评估中的应用[J].哈尔滨工业大学学报,2006,38(9):1504-1505. 被引量：7
4郑恩辉,许宏,李平,宋执环.基于ν-SVM的不平衡数据挖掘研究[J].浙江大学学报（工学版）,2006,40(10):1682-1687. 被引量：8
5陈李钢,叶强,李一军.基于遗传算法的银行客户信用评估模型研究[J].计算机工程,2007,33(3):70-72. 被引量：3
6GB9660-88.机场周围飞机噪声环境标准[S].[S].中国科学院声学研究所北京:国家环境保护局,1988..
7DIETTERICH T a. Machine learning research: four current directions [J]. AI Magazine, 1997, 18(4): 97-136.
8TAKEMURA A, SHIMIZU A, HAMAMOTO Z. Discrim- ination of breast tumors in ultrasonic images us- ing an ensemble classifier based on AdaBoost algo- rithm with feature selection [J]. IEEE Transactions on Medical Imaging, 2010, 20(3): 598-609.
9LI Lingli. A survey of classifier in data mining [J]. Journal of Chongqing Normal University, 2011, 2s(4): 44-47.
10BREIMAN L. Bagging predictors [J]. Machine Learn- ing, 1996, 24 (2): 123-140.

引证文献9

1周红芳,王啸,赵雪涵,饶元.基于频繁模式的选择性集成[J].应用科学学报,2013,31(6):628-632.
2李瑞.基于聚类的动态集成选择算法[J].计算机应用与软件,2014,31(8):317-323. 被引量：2
3赵强利,蒋艳凰,卢宇彤.具有回忆和遗忘机制的数据流挖掘模型与算法[J].软件学报,2015,26(10):2567-2580. 被引量：15
4谢华,陈海燕,袁立罡.基于SVR选择性集成的机场噪声预测模型研究[J].航空计算技术,2016,46(1):16-18. 被引量：2
5吴陈,杨镕华.基于垂直数据格式频繁闭项集的选择性集成算法的研究[J].电子设计工程,2016,24(19):69-72.
6王宇燕,王杜娟,王延章,Yaochu Jin.改进随机森林的集成分类方法预测结直肠癌存活性[J].管理科学,2017,30(1):95-106. 被引量：16
7赵强利,蒋艳凰.类别严重不均衡应用的在线数据流学习算法[J].计算机科学,2017,44(6):255-259. 被引量：1
8江峰,张友强,杜军威,刘国柱,眭跃飞.基于随机贪心选择的选择性集成算法[J].济南大学学报（自然科学版）,2017,31(1):67-72.
9刘勘,张雅荃.基于医疗知识图谱的并发症辅助诊断[J].中文信息学报,2020,34(10):85-93. 被引量：14

二级引证文献50

1陈亚科.基于大数据的信息传输过程中数据安全性的研究[J].电子测量技术,2020(7):119-123. 被引量：10
2李尧,王志海,孙艳歌,张伟.一种基于深度属性加权的数据流自适应集成分类算法[J].山东大学学报（工学版）,2018,48(6):44-55. 被引量：3
3林雪云.基于游戏玩家流失预警的改进决策树算法[J].长春工业大学学报,2016,37(2):182-186.
4李飞,齐林.基于决策树C4.5算法的大数据保险业模型研究[J].中国市场,2017(2):71-73. 被引量：3
5曾蒸.异构网络信息中漂移数据流检测研究[J].计算机仿真,2017,34(3):357-360. 被引量：5
6赵强利,蒋艳凰.类别严重不均衡应用的在线数据流学习算法[J].计算机科学,2017,44(6):255-259. 被引量：1
7李桃迎,李墨,李鹏辉.基于加权Slope One的协同过滤个性化推荐算法[J].计算机应用研究,2017,34(8):2264-2268. 被引量：23
8黄皓璇,邢延.基于用户兴趣变化的Slope One协同过滤推荐算法[J].工业控制计算机,2017,30(7):112-113. 被引量：2
9王波,王怀彬.基于主动学习的非均衡异常数据分类算法研究[J].信息网络安全,2017(10):42-49. 被引量：1
10刘强,李桐,于洋,蔡志平,周桐庆.面向可穿戴设备的数据安全隐私保护技术综述[J].计算机研究与发展,2018,55(1):14-29. 被引量：28

1李焱.一种BP神经网络改进算法的研究[J].齐齐哈尔大学学报（自然科学版）,2010,26(4):11-15. 被引量：4
2母丽华,张太发,李焱.改进的神经网络算法在瓦斯涌出量预测中的应用[J].黑龙江科技学院学报,2011,21(3):240-243.
3赵志宏,黄蕾,刘峰,陈振宇.Deep Web搜索技术进展综述[J].山东大学学报（工学版）,2009,39(2):15-20. 被引量：5
4曹林,韩立新,吴胜利.元搜索引擎排序技术综述[J].计算机应用研究,2009,26(2):411-414. 被引量：26
5吴庆涛,曹继邦,郑瑞娟,张聚伟.基于粒子群优化的入侵特征选择算法[J].计算机工程与应用,2013,49(7):89-92. 被引量：5
6方万胜,朱嘉钢,陆晓.基于Fisher核的混合核构造研究[J].计算机应用,2013,33(4):994-997.
7倪勇,吴汶芪,李君.基于小样本的集成学习研究[J].机电工程,2009,26(12):41-44.
8戴洪玲.时间一到邮件出发[J].电脑爱好者（普及版）,2007,0(7):67-67.
9盛高斌,姚明海.基于半监督回归的选择性集成算法[J].计算机仿真,2009,26(10):198-201. 被引量：4
10陈建胜.基于粒子群优化算法的支持向量机选择性集成[J].温州科技职业学院学报,2012,4(1):54-57.

计算机工程与科学

2012年第2期

浏览历史

内容加载中请稍等...

选择性集成算法分类与比较被引量：9

参考文献9

同被引文献55

引证文献9

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

选择性集成算法分类与比较 被引量：9

参考文献9

同被引文献55

引证文献9

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

选择性集成算法分类与比较被引量：9