-
题名优化AUC两遍学习算法
- 1
-
-
作者
栾寻
高尉
-
机构
南京大学计算机软件新技术国家重点实验室
-
出处
《智能系统学报》
CSCD
北大核心
2018年第3期395-398,共4页
-
基金
国家自然科学基金青年科学基金项目(61503179)
江苏省青年基金项目(BK20150586)
-
文摘
ROC曲线下的面积(简称AUC)是机器学习中一种重要的性能评价准则,广泛应用于类别不平衡学习、代价敏感学习、排序学习等诸多学习任务。由于AUC定义于正负样本之间,传统方法需存储整个数据而不能适用于大数据。为解决大规模问题,前人已提出优化AUC的单遍学习算法,该算法仅需遍历数据一次,通过存储一阶与二阶统计量来进行优化AUC学习。然而在实际应用中,处理二阶统计量依然需要很高的存储与计算开销。为此,本文提出了一种新的优化AUC两遍学习算法TPAUC(two-pass AUC optimization)。该算法的基本思想是遍历数据两遍,第一遍扫描数据获得正、负样本的均值,第二遍采用随机梯度下降方法优化AUC。算法的优点在于通过遍历数据两遍来避免存储和计算二阶统计量,从而提高算法的效率,最后本文通过实验说明方法的有效性。
-
关键词
机器学习
AUC
ROC
单遍学习
在线学习
排序
随机梯度下降
统计量
-
Keywords
machine learning
AUC
ROC
one-pass learning
online learning
ranking
stochastic gradient descent
statistics
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-