-
题名基于加速骨干二元粒子群优化的样本规约方法
- 1
-
-
作者
罗少甫
刘河
-
机构
重庆航天职业技术学院基础学科部
-
出处
《统计与决策》
2024年第22期59-64,共6页
-
基金
重庆市教育委员会科学技术研究项目(KJQN202203007)
重庆市教育科学规划项目(K22YG218233)
+1 种基金
重庆市科研院所绩效激励引导专项项目(cstc2022jxj10214)
重庆市教委科学技术研究计划重点项目(KJZD-K202114401)。
-
文摘
样本规约方法是统计机器学习中的杰出数据预处理范式,能从有标记训练集中移除冗余样本和噪声,从而提升分类统计算法的性能。虽然学者们提出了大量基于进化算法的样本规约方法,并证明了其有效性,但是现有基于进化算法的样本规约方法依赖太多参数。而且随着有标记训练集中的样本数量增加,现有基于进化算法的样本规约方法的搜索效率较低且时间成本较高。为了克服上述问题,文章提出一种基于加速骨干二元粒子群优化的样本规约方法(SRM-HBPSO)。在SRM-HBPSO中,首先,设计了一种结合搜索空间约简策略的加速骨干二元粒子群优化算法(HBPSO);其次,用HBPSO优化有标记训练集,从而得到一个被优化的约简子集;最后,SRM-HBPSO在被优化的约简子集上训练给定的分类统计算法,从而改进其性能。经仿真实验证明,就改进随机森林分类统计算法的平均分类正确率和提升平均样本约简率而言,在来自金融、医疗、图像等领域的10个真实基准数据集上,SRM-HBPSO优于5个先进的样本规约算法。
-
关键词
统计机器学习
分类统计算法
样本规约
随机森林
搜索空间约简策略
-
Keywords
statistical machine learning
classification statistical algorithm
sample specification
random forest
search space reduction strategy
-
分类号
O212
[理学—概率论与数理统计]
TP391
[自动化与计算机技术—计算机应用技术]
-