-
题名基于损失函数的代价敏感集成算法
被引量:5
- 1
-
-
作者
陈白强
盛静文
江开忠
-
机构
上海工程技术大学数理与统计学院
-
出处
《计算机应用》
CSCD
北大核心
2020年第S02期60-65,共6页
-
基金
全国统计科学研究项目(2018LY16)
上海市教委创新项目(cs1921004)。
-
文摘
大数据背景下,现实生活中存在大量的非平衡数据,不同类别样本数量不平衡,而且在个体错分成本或错分损失上也不平衡。对于数量上的不平衡,已有许多成功的算法,典型的方法是在学习的过程中动态地改变样本个体的权重;但是针对错分成本的算法很少,原因之一是这种损失在实际问题中很难获得。对于数据集中每一个个体都潜在地存在可能给机构带来的错分损失,提出一个基于投影距离的错分损失期望的函数,并将这个函数用于数据分类集成算法中。分类集成算法的迭代过程中,弱分类器的选择原则是使得正确分类个体的权重之和与损失期望之和的加权和取最大值的弱分类器。在UCI数据集上的实验结果表明,在保持传统集成算法分类性能的基础上,所提算法能较好地提高少数类的分类性能。
-
关键词
数据不平衡
向量投影
损失期望
集成算法
损失召回率
-
Keywords
data imbalance
vector projection
loss expectation
ensemble algorithm
loss recall
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-