期刊文献+

基于主成份分析的Bagging集成学习方法 被引量:8

PCA Based Bagging Ensemble Methods
下载PDF
导出
摘要 机器学习中数据集的冗余特征会影响学习器的泛化能力,一些流行方法如支持向量机和集成学习也难免于此.研究了利用主成份分析进行特征变换对Bagging集成学习算法的影响,提出一种称为PCA-Bagging的算法,并与其它算法比如单个支持向量机、支持向量机Bagging集成、带有特征变换的单个支持向量机等进行了性能比较.在多个UCI标准数据集上的实验表明PCA-Bagging算法具有更好的性能,这说明即使是泛化能力很强的集成学习方法其学习的数据也需要进行适当的特征变换. Redundant features in data sets hurt the generalization performance of learning machines. Even the state-of-arts algorithms such as support vector machine (SVM) and ensemble learning are not immune to it. This paper studies the effect of feature transformation with principal component analysis (PCA) on bagging method of ensemble learning. This paper proposes a new method termed PCA-bagging, which is compared with other methods such as single SVM, bagging of SVM and SVM with PCA. Experiments on UCI machine learning benchmark data sets show that PCA-bagging has better generalization performance, indicating that even ensemble learning methods with excellent generalization ability also need proper feature preprocessing.
出处 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第4期415-418,427,共5页 Journal of Shanghai University:Natural Science Edition
基金 国家自然科学基金资助项目(20503015) 上海市教委自然科学一般资助项目(05AZ67)
关键词 集成学习 主成份分析 支持向量机 ensemble learning principal component analysis support vector machine
  • 相关文献

参考文献8

  • 1YU L,LIU H.Efficient feature selection via analysis of relevance and redundancy[J].Journal of Machine Learning Research,2004,5:1205-1224.
  • 2杨丽明.基于SVM理论的一种新的数据分类方法[J].数学的实践与认识,2003,33(12):61-65. 被引量:25
  • 3CristianiniN Shawe-TaylorJ 李国正译.支持向量机导论[M].北京:电子工业出版社,2004..
  • 4刘学军,陈松灿,彭宏京.基于支持向量机的计算机键盘用户身份验真[J].计算机研究与发展,2002,39(9):1082-1086. 被引量:26
  • 5CHEN N Y,LU W-C,YANG J,et al.Support vector machines in Chemistry[M].Singapore:World Scientific Publishing Company,2004:74-305.
  • 6BREIMAN L.Bagging predictors[J].Machine Learning,1996,24(2):123-140.
  • 7周志华,陈世福.神经网络集成[J].计算机学报,2002,25(1):1-8. 被引量:244
  • 8BLAKE C,KEOGH E,MERZ C J.UCI repository of machine learning databases[R/OL].Department of Information and Computer Science,University of California,Irvine,CA,1998[2005-05-10].http://www.ics.uci.edu/mlearn/MLRepository.htm.

二级参考文献6

共引文献400

同被引文献79

引证文献8

二级引证文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部