期刊文献+

差异性随机子空间集成 被引量:3

Diverse Random Subspace Ensemble
下载PDF
导出
摘要 随机子空间集成方法是集成学习中的一个重要部分,它通过随机选取原特征空间中的数个子空间构建基分类器并集成基学习器得到最终的结果。随机子空间集成方法尤其适用于特征维度高于样本数量的情况,而传统的随机子空间集成对高维数据采集大量的子空间且子空间之间存在很高的冗余度,从而导致模型获得较差的性能。因此,提出了一种无监督和不需要训练的差异性随机子空间集成算法。该算法利用多核最大均值差异(maximum mean discrepancy,MMD)作为子空间的相似性度量,并利用谱聚类算法将高相似性子空间聚类,从中选择一个代表性子空间,从而得到差异性子空间集合。实验表明,基于差异性随机子空间集成的模型在使用较少的基学习器时依然能获得较好的性能,尤其在具有很高的特征-样本比的数据集上。 Random subspace ensemble method is an essential part of ensemble learning research.It constructs several base learners on randomly selected feature subspaces,and finds a suitable way to combine the results of these base learners to give a final result.Random subspace ensemble method is much suitable for datasets with much higher feature dimensions than samples.However,because of the high feature dimensions,the ensemble model should sample numerous subspaces but cannot keep enough diversity between these subspaces,which causes low efficiency and bad performance.This paper proposes a diverse random subspace ensemble method without supervision and training.This method uses the multi-kernel MMD(maximum mean discrepancy)as similarity measure of subspace,and uses the spectral clustering algorithm on high similarity subspaces to select a representative subspace among lots of random subspaces with similar distribution structure.The experimental results demonstrate the effectiveness and efficiency of the proposed method when using less base learners,especially on datasets with high feature-sample ratio.
作者 丁毅 王明亮 张道强 DING Yi;WANG Mingliang;ZHANG Daoqiang(College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 211100,China)
出处 《计算机科学与探索》 CSCD 北大核心 2018年第9期1434-1443,共10页 Journal of Frontiers of Computer Science and Technology
基金 国家自然科学基金Nos.61473149 61422204~~
关键词 随机子空间集成 差异性度量 集成学习 机器学习 random subspace ensemble diversity ensemble learning machine learning
  • 相关文献

同被引文献33

引证文献3

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部