基于差异性的分类器集成:有效性分析及优化集成被引量：19

Classifier Ensemble with Diversity: Effectiveness Analysis and Ensemble Optimization

下载PDF

导出

摘要差异性是分类器集成具有高泛化能力的必要条件.然而,目前对差异性度量、有效性及分类器优化集成都没有统一的分析和处理方法.针对上述问题,本文一方面从差异性度量方法、差异性度量有效性分析和相应的分类器优化集成技术三个角度,全面总结与分析了基于差异性的分类器集成.同时,本文还通过向量空间模型形象地论证了差异性度量的有效性.另一方面,本文针对多种典型的基于差异性的分类器集成技术(Bagging,boosting GA-based,quadratic programming(QP)、semi-definite programming(SDP)、regularized selective ensemble(RSE))在UCI数据库和USPS数据库上进行了对比实验与性能分析,并对如何选择差异性度量方法和具体的优化集成技术给出了可行性建议. Diversity is a necessary condition for high generalization capability in classifier ensemble. However, ther exists no uniform analysis and operation methods for diversity measure, effectiveness analysis or ensemble optimizatio. To solve these issues, on the one hand, classifier ensemble with diversity is comprehensively summarized and analyze, from three aspects, i.e., diversity measurement methods, effectiveness analysis for diversity measurement methods an, optimization techniques for classifier ensemble. Moreover, the effectiveness of diversity is also demonstrated by the vecto space model. On the other hand, comparative experiments and analysis have been performed on UCI data sets and USPS data set with a variety of typical classifier ensemble methods （Bagging, boosting, GA-based, quadratic programming （QP）, semi-definite programming （SDP）, regularized selective ensemble （RSE））. Finally, we give some suggestions on how to select diversity measurement methods and optimization techniques in ensemble.

作者杨春殷绪成郝红卫闫琰王志彬

机构地区北京科技大学计算机与通信工程学院计算机科学与技术系北京科技大学材料领域知识工程北京市重点实验室中国科学院自动化研究所国家农业信息化工程技术研究中心

出处《自动化学报》 EI CSCD 北大核心 2014年第4期660-674,共15页 Acta Automatica Sinica

基金国家自然科学基金(61105018 61175020)资助~~

关键词分类器集成差异性有效性分析优化 Classifier ensemble, diversity, effectiveness analysis, optimization

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献67

1Polikar R. Ensemble learning. Ensemble Machine Learning: Methods and Applications. New York: Springer, 2012. 1-34.
2Zhou Z H. Ensemble Methods: Foundations and Algorithms. New York: CRC Press, 2012.
3Lebanon G, Lafferty J. Boosting and maximum likelihood for exponential models. Advances in Neural Information Processing Systems 14. Cambridge: MIT Press, 2002. 447-454.
4Lee H, Kim E, Pedrycz W. A new selective neural network ensemble with negative correlation. Applied Intelligence, 2012, 37(4): 488-498.
5Liu C L. Classifier combination based on confidence transformation. Pattern Recognition, 2005, 38(1): 11-28.
6Shipp C A, Kuncheva L K. Relationships between combination methods and measures of diversity in combining classifiers. Information Fusion, 2002, 3(2): 135-148.
7Jiang L X, Cai Z H, Zhang H, Wang D H. Naive Bayes text classifiers: a locally weighted learning approach. Journal of Experimental & Theoretical Artificial Intelligence, 2013, 25(2): 273-286.
8Yuksel S E, Wilson J N, Gader P D. Twenty years of mixture of experts. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(8): 1177-1193.
9Shi L, Wang Q, Ma X M, Weng M, Qiao H B. Spam email classification using decision tree ensemble. Journal of Computational Information Systems, 2012, 8(3): 949-956.
10Malisiewicz T, Gupta A, Efros A A. Ensemble of exemplar-SVMs for object detection and beyond. In: Proceedings of the 13th International Conference on Computer Vision. Barcelona, Spain: IEEE, 2011. 89-96.

二级参考文献157

1李强,裘正定,孙冬梅,刘陆陆.基于改进二维主成分分析的在线掌纹识别[J].电子学报,2005,33(10):1886-1889. 被引量：36
2袁国武,魏骁勇,徐丹.基于掌纹的身份鉴别[J].计算机辅助设计与图形学学报,2005,17(12):2590-2595. 被引量：11
3王长宇,宋尚玲,孙丰荣,梅良模.一种新的生物特征识别模式-手指背关节皮纹识别[J].自动化学报,2006,32(3):360-367. 被引量：2
4王丽丽,苏德富.基于群体智能的选择性决策树分类器集成[J].计算机技术与发展,2006,16(12):55-57. 被引量：3
5Thompson S. Pruning boosted classifiers with a real valued genetic algorithm. Knowledge-Based Systems, 1999, 12(5-6): 277-284.
6Zhou Z H, Tang W. Selective ensemble of decision trees// Proceedings of the 9th International Conference on Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing. Chongqing, China, 2003:476-483.
7Hernandez-Lobato D, Hernandez-Lobato J M, Ruiz-Torrubiano R, Valle A. Pruning adaptive boosting ensembles by means of a genetic algorithm//Corchado et al. International Conference on Intelligent Data Engineering and Automated Learning. Berlin Heidelberg: Springer-Verlag, 2006: 322- 329.
8Zhang Y, Burer S, Street W N. Ensemble pruning via semidefinite programming. Journal of Machine Learning Research, 2006, 7: 1315-1338.
9Chen H H, Tino P, Yao X. Predictive ensemble pruning by expectation propagation. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(7): 999-1013.
10Dos Santos E M, Sahourin R, Maupin P. Overfitting cautious selection of classifier ensembles with genetic algorithms. Information Fusion, 2009, 10(2): 150-162.

共引文献214

1王茂光,冀昊悦,王天明.一种基于层次聚类和模拟退火的选择性集成算法的风控模型研究[J].计算机科学,2022,49(S02):201-207. 被引量：1
2崔宇,侯慧娟,苏磊,钱涛,盛戈皞,江秀臣.考虑不平衡案例样本的电力变压器故障诊断方法[J].高电压技术,2020,46(1):33-41. 被引量：33
3隋国华,李春雷.基于组合分类器的地层含油情况智能决策系统[J].计算机研究与发展,2011,48(S3):476-479.
4朱虹,李晗,辛威,邓颖娜.基于多特征的多分类器融合决策印鉴识别[J].计算机工程与应用,2004,40(34):215-217.
5孙权森,曾生根,杨茂龙,王平安,夏德深.基于典型相关分析的组合特征抽取及脸像鉴别[J].计算机研究与发展,2005,42(4):614-621. 被引量：30
6张健沛,程丽丽,杨静,马骏.基于全信息相关度的动态多分类器融合[J].计算机科学,2008,35(3):188-190. 被引量：5
7张宏达,王晓丹,刘倞源,徐海龙.基于截止投票的SVM集成快速分类方法[J].数据采集与处理,2009,24(4):476-482.
8米爱中,郝红卫,郑雪峰,涂序彦.一种自整定权值的多分类器融合方法[J].电子学报,2009,37(11):2604-2608. 被引量：9
9张宏达,王晓丹,韩钧,徐海龙.分类器集成差异性研究[J].系统工程与电子技术,2009,31(12):3007-3012. 被引量：9
10杜吉祥,余庆,翟传敏.基于稀疏性约束非负矩阵分解的人脸年龄估计方法[J].山东大学学报（理学版）,2010,45(7):65-69. 被引量：4

同被引文献161

1蔡美峰,王鹏,赵奎,张登科.基于遗传算法的岩体结构面的模糊C均值聚类方法[J].岩石力学与工程学报,2005,24(3):371-376. 被引量：38
2唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
3王晓鹏,曾永年,丁生喜,曹广超.基于改进主成分分析方法的复杂环境系统质量评价模型[J].系统工程理论与实践,2005,25(11):112-118. 被引量：22
4王欣.MATLAB在图像处理中的应用[J].内江师范学院学报,2007,22(2):55-56. 被引量：3
5范雷,王亮清,唐辉明.节理岩体结构面产状的动态聚类分析[J].岩土力学,2007,28(11):2405-2408. 被引量：36
6岑喆鑫,李宝聚,石延霞,黄海洋,刘君,廖宁放,冯洁.基于彩色图像颜色统计特征的黄瓜炭疽病和褐斑病的识别研究[J].园艺学报,2007,34(6):1425-1430. 被引量：39
7KUNCHEVA L I,SKURICHINA M,DUIN R P W.An experimental study on diversity for bagging and boosting with linear classifiers[J].Information Fusion,2002,3(4):245-258.
8BROWN G,KUNCHEVA L I.“Good”and“bad”diversity in majority vote ensembles[C]∥Proceedings of International Conference on Multiple Classifier Systems.Berlin,Germany:Springer,2010:124-133.
9NASCIMENTO D,COELHO A,CANUTO A.Integrating complementary techniques for promoting diversity in classifier ensembles:a systematic study[J].Neurocomputing,2014,138:347-357.
10KUNCHEVA L I,WHITAKER C J.Measures of diversity in classifier ensembles and their relationship with the ensemble accuracy[J].Machine Learning,2003,51:181-207.

引证文献19

1赵军阳,韩崇昭,韩德强,张春霞.采用互补信息熵的分类器集成差异性度量方法[J].西安交通大学学报,2016,50(2):13-19. 被引量：4
2雷英杰,余晓东,王睿,王毅.根据混合选择策略的直觉模糊核匹配追踪集成算法[J].控制理论与应用,2016,33(3):336-343. 被引量：1
3邵良杉,马寒,温廷新.极限学习机的分类器集成模型研究[J].计算机工程与应用,2016,52(13):121-125. 被引量：3
4吴梅红,郭佳盛,鞠颖,林子雨,邹权.基于分层筛选和动态更新的并行选择集成算法[J].计算机科学,2017,44(1):48-52. 被引量：2
5杨帆,杨大利,朱熹.基于支持向量机集成方法的膀胱癌预后研究[J].北京信息科技大学学报（自然科学版）,2017,32(1):24-31.
6刘荣胜,彭敏放,张海燕,万勋,沈美娥.基于动态集成LSSVR的超短期风电功率预测[J].湖南大学学报（自然科学版）,2017,44(4):79-86. 被引量：3
7王军,刘三民,刘涛.具有噪声的动态数据流集成分类方法[J].内江师范学院学报,2017,32(8):51-55.
8王志彬,王开义,王书锋,王晓锋,潘守慧.基于动态集成的黄瓜叶部病害识别方法[J].农业机械学报,2017,48(9):46-52. 被引量：11
9郑丽容,洪志令.HSEC:基于聚类的启发式选择性集成[J].南京大学学报（自然科学版）,2018,54(1):116-123.
10李京政,杨习贝,王平心,陈向坚.模糊粗糙集的稳定约简方法[J].南京理工大学学报,2018,42(1):68-75. 被引量：11

二级引证文献72

1曹聪,秦秀山,于世波,王虎强,曹雪伟.某铜镍矿两步骤嗣后充填回采地压分布与采场稳定性研究[J].中国矿业,2024,33(S01):297-303.
2王楚鑫,王迎超,董传新,武佩锋,张政.基于时间序列聚类和粒模型的地面沉降模式分析[J].岩土力学,2024,45(S01):631-644.
3王茂光,冀昊悦,王天明.一种基于层次聚类和模拟退火的选择性集成算法的风控模型研究[J].计算机科学,2022,49(S02):201-207. 被引量：1
4徐坤财,冯宝,陈业航,刘昱,周皓阳,陈相猛.结合深度学习与改进的极限学习机的集成学习胸腺瘤CT图像预测方法[J].计算机科学,2022,49(S02):455-460. 被引量：1
5乔虹,冯全,张芮,刘阗宇.基于时序图像跟踪的葡萄叶片病害动态监测[J].农业工程学报,2018,34(17):167-175. 被引量：17
6李丽.多因素多水平复杂正交试验的方差分析[J].延安大学学报（自然科学版）,2018,37(3):27-31. 被引量：6
7章宁,陈钦.基于TF-IDF算法的P2P贷款违约预测模型[J].计算机应用,2018,38(10):3042-3047. 被引量：9
8李慧真.基于大数据处理技术的界面交互设计研究[J].现代电子技术,2019,42(1):38-41. 被引量：12
9雷蕾,余晓东,王晓丹,罗玺,王艺菲.基于免疫克隆选择的最优ECOC编码输出[J].电子学报,2018,46(12):3044-3049.
10夏秀云,常安成,刘一龙,田浩.关于模糊粗糙集的广义扩张原理的注记[J].舰船电子工程,2019,39(2):99-102.

1张兴福,黄少滨.基于马氏距离度量的局部线性嵌入算法[J].模式识别与人工智能,2012,25(2):318-324. 被引量：4
2刘玉文.前途广阔的Tina Pr0技术[J].河北能源职业技术学院学报,2004,4(1):39-40. 被引量：2
3西数发布Pro系列存储新品[J].数码摄影,2016,0(8):138-138.
4汤文芳.浅谈Pro/E中曲线的实际应用[J].科技广场,2007(11):140-141.
5董辛旻,石来德,韩捷,简小刚.基于矢谱和粗糙集理论的旋转机械故障诊断[J].中国工程机械学报,2008,6(1):78-83. 被引量：2
6姚程宽.双正则化参数SVM的不同实验结果[J].成都师范学院学报,2014,30(3):118-121.
7张凯兵,肖淑芬,刘中华.基于位映像编码的手写字符样本存取方法[J].西华大学学报（自然科学版）,2006,25(5):45-47.
8王玲.Pro/E三维造型与AutoCAD二维图形的转换技术及其在机械设计中的应用[J].矿山机械,2004,32(5):74-76.
9常旭睿.基于Pro/E Wildfire 3.0的电极设计[J].模具制造,2006,6(12):48-50. 被引量：2
10刘英,冯云.WebSphere Application Server内存溢出问题初探[J].甘肃科技,2008,24(15):27-29. 被引量：2

自动化学报

2014年第4期

浏览历史

内容加载中请稍等...

基于差异性的分类器集成:有效性分析及优化集成被引量：19

参考文献67

二级参考文献157

共引文献214

同被引文献161

引证文献19

二级引证文献72

相关作者

相关机构

相关主题

浏览历史

基于差异性的分类器集成:有效性分析及优化集成 被引量：19

参考文献67

二级参考文献157

共引文献214

同被引文献161

引证文献19

二级引证文献72

相关作者

相关机构

相关主题

浏览历史

基于差异性的分类器集成:有效性分析及优化集成被引量：19