-
题名邻域欠采样的AdaBoostv算法
被引量:1
- 1
-
-
作者
张振莲
鲁淑霞
翟俊海
-
机构
河北大学数学与信息科学学院
河北大学河北省机器学习与计算智能重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第1期97-102,共6页
-
基金
河北省科技计划重点研发项目(19210310D)资助
河北省自然科学基金项目(F2021201020)资助。
-
文摘
针对类别非平衡情况下的类重叠问题,引入了两种基于邻域的欠采样方法:共同近邻搜索欠采样和递归搜索欠采样,其主要思想是通过消除重叠区域中的负类样本来缓解类别非平衡问题,学习算法采用AdaBoost v算法,通过最大化样本的最小间隔(最优间隔)来提高分类器的分类能力.为了进一步解决非平衡数据分类问题,AdaBoost v算法的基分类器采用加权最优间隔分布机模型,对模型中的间隔均值项和铰链损失项加权,权值是依据数据的非平衡比给出的,并利用带有方差减小的随机梯度下降方法对优化模型进行求解,以提高算法的收敛速度.对比实验表明,提出的算法在非平衡数据分类问题上具有明显的优势.
-
关键词
欠采样
AdaBoost
v
最优间隔分布机
类重叠问题
权值
-
Keywords
undersampling
AdaBoostv
optimal margin distribution machine
the problem of class overlap
weight
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-