期刊文献+

基于粒子群优化的生物组学数据分类模型选择 被引量:2

Model selection based on particle swarm optimization for omics data classification
下载PDF
导出
摘要 针对生物组学数据普遍存在的高维小样本和样本分布不平衡问题,提出基于粒子群优化分类模型选择算法.该算法中粒子编码由样本平衡模型、特征选择模型和分类模型及超参数构成,粒子种群以达到以生物组学数据最佳分类性能为目标,通过对粒子的速度和位置进行迭代更新,得到模型组合及超参数的最优解.在8组真实生物组学数据集上的实验结果表明,所提模型选择算法能够避免人为选择所带来的主观偏差,提高最佳分类性能和稳定性. A new model selection algorithm based on particle swarm optimization is proposed for omics data classification. Specifically,the algorithm is designed to handle the high dimensionality,small sample size and class imbalance problems that are inherent in omics data. The particles encode candidate combinations of data sampling,feature selection,classification models and their corresponding parameter settings. The swarm optimization is targeted at the best classification performance. The particle velocity and position are iteratively updated until some stopping criteria are met and then the optimal solution model combination is output. The simulation results on eight real-world omics datasets show that the proposed model selection algorithm is capable of avoiding the bias introduced by manual settings and leading to accurate and reliable classification performance.
出处 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2016年第3期264-271,共8页 Journal of Shenzhen University(Science and Engineering)
基金 国家自然科学基金资助项目(61171125 61471246)~~
关键词 生物组学 粒子群优化 样本平衡 特征选择 分类模型 模型选择 数据挖掘 omics dataset particle swarm optimization data sampling feature selection classification model model selection data mining
  • 相关文献

参考文献3

二级参考文献23

  • 1姜来,黄彩玲,纪震.基于粒子群优化算法的矢量量化图像压缩方法[J].深圳大学学报(理工版),2006,23(3):268-271. 被引量:3
  • 2胡恒滔,龙建忠.基于蚁群算法的模糊C-均值聚类算法在声纹识别中的应用[J].四川大学学报(自然科学版),2007,44(3):543-547. 被引量:10
  • 3赵力.语音信号处理[M].北京:机械工业出版社,2004,236-253.
  • 4Soong F K,Rosenberg A E,Rabiner L R,等.矢量量化的说话人识别方法[C].国际声学、语音和信号处理会议.美国电气电子工程师学会,1985.387-390.
  • 5Tran D,Wagner M,Van L T.一种基于模糊C-均值的说话人识别新策略[C].第五届国际口语处理会议.澳大利亚悉尼:澳大利亚语音和技术协会,1998,755-758.
  • 6许文焕 Nandi A K 张基宏.利用加强学习作为预处理的模糊矢量量化算法.信号处理,2005,85(7):1315-1333.
  • 7Kennedy J,Eberhart R.粒子群优化[C].国际神经网络会议.美国新泽两州皮斯卡塔韦:美国电气电子工程师学会,1995.1942-1948.
  • 8薛丽萍,尹俊勋,纪震,等.一种应用于隐马尔可夫模型训练的粒子群优化算法[C].第8届国际信号处理会议.桂林:美国电气电子工程师学会,2006.791-794.
  • 9Garofolo J S,Lamel L F.TIMIT声学-语音学连续语音库[DB/CD].美国费城:语言数据协会,[2007-12-20]http://www.Ide.upenn.edtt/Catalog/.
  • 10纪震,廖惠连,许文焕,姜来.粒子对算法在图像矢量量化中的应用[J].电子学报,2007,35(10):1916-1920. 被引量:10

共引文献15

同被引文献16

引证文献2

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部