最大化AUC的正例未标注分类及其增量算法被引量：1

Maximize AUC for Positive-Unlabeled Classification and Incremental Algorithm

下载PDF

导出

摘要正例未标注分类简称PU分类,由于只有正例样本与未标注样本,传统的分类方法在PU分类中往往效果不甚理想。为此利用PU分类下的AUC与传统分类下的AUC关系,提出了将传统分类方法中AUC作为目标函数应用到PU分类中,利用高斯核函数将原始样本映射到高维空间使数据线性可分。通过优化AUC目标函数得到解析解避免了多次迭代的麻烦,并可以推导出增量公式,加快了运算速度。实验结果表明,所提算法实现了与训练集内所有正例与负例标签都已知的理想支持向量机(SVM)相近的性能,并且实现了快速增量,是处理现实问题的有力工具。 Positive-unlabeled classification is referred to as PU classification.Since there are only positive samples and unlabeled samples,the traditional classification methods are not effective in PU classification.For this reason,this paper proposes to apply AUC(area under receiver operating characteristic curve)in traditional classification methods as an objective function to PU classification because of the relationship between AUC under PU classification and traditional classification.For making the data linearly separable,this paper uses Gaussian kernel function to map the original sample to high-dimensional space.Optimizing the AUC objective function to obtain an analytical solution avoids the trouble of multiple iterations,and can derive an incremental formula to speed up the operation speed.Experimental results show that the proposed algorithm achieves performance similar to an ideal support vector machine(SVM)whose labels are known for all positive and negative examples in the training set,and achieves rapid increments.It is a powerful tool for dealing with real problems.

作者马毓敏王士同 MA Yumin;WANG Shitong(School of Artificial Intelligence and Computer Science,Jiangnan University,Wuxi,Jiangsu 214122,China)

机构地区江南大学人工智能与计算机学院

出处《计算机科学与探索》 CSCD 北大核心 2020年第11期1879-1887,共9页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金No.61572236。

关键词机器学习 PU分类 AUC 增量算法 machine learning positive-unlabeled(PU)classification AUC incremental algorithm

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1冯昌,廖士中.大规模核方法的随机假设空间方法[J].计算机科学与探索,2018,12(5):785-793. 被引量：6

二级参考文献2

1刘勇,江沙里,廖士中.基于近似高斯核显式描述的大规模SVM求解[J].计算机研究与发展,2014,51(10):2171-2177. 被引量：4
2冯昌,廖士中.随机傅里叶特征空间中高斯核支持向量机模型选择[J].计算机研究与发展,2016,53(9):1971-1978. 被引量：10

共引文献5

1黄裕.基于多视角缺失补全算法的数据挖掘研究[J].计算技术与自动化,2018,37(2):67-72. 被引量：1
2沈浩,王士同.基于多核学习的风格正则化最小二乘支持向量机[J].计算机科学与探索,2020,14(9):1532-1544. 被引量：1
3王鸿菲,杜洪波,林凯迪,姚云飞,朱立军.一种适合于非线性高维数据的谱聚类算法[J].计算机应用与软件,2021,38(9):268-272. 被引量：2
4倪中源,刘惊雷.基于图滤波的快速谱聚类[J].山西大学学报（自然科学版）,2022,45(1):1-14.
5张凯,门昌骞,王文剑.基于随机傅里叶特征空间的高斯核近似模型选择算法[J].数据采集与处理,2023,38(3):616-628. 被引量：2

同被引文献9

1姚明海,林宣民,王宪保.基于局部敏感Hash的半监督直推SVM增量学习算法[J].浙江工业大学学报,2018,46(2):127-131. 被引量：4
2王映龙,华佳佳,钱文彬,柳军.集值决策信息系统的增量式属性约简算法[J].小型微型计算机系统,2018,39(6):1239-1244. 被引量：3
3杨喜敏,胡明明,唐菀.动态的SDN网络流量模式增量学习算法[J].中南民族大学学报（自然科学版）,2018,37(2):98-103. 被引量：2
4李雄伟,魏延海,王晓晗,徐璐,孙萍.一种面向硬件木马检测的SVDD增量学习改进算法[J].计算机工程与应用,2019,55(9):43-48. 被引量：3
5李德宜,曾弦,周勇.基于子空间距离的局部切空间增量学习[J].武汉科技大学学报,2019,42(5):394-400. 被引量：2
6吕艳霞,刘波男,王翠荣,王聪,万聪.面向概念漂移数据流的自适应增量集成分类算法[J].小型微型计算机系统,2019,40(12):2624-2630. 被引量：11
7韩素青,成慧雯,王宝丽.三支决策朴素贝叶斯增量学习算法研究[J].计算机工程与应用,2020,56(18):42-49. 被引量：4
8徐岩柏,景运革.分布决策信息系统增量属性约简算法[J].微电子学与计算机,2020,37(9):31-36. 被引量：1
9王丹,王萌,王晓曦,杨萍.用于航班延误预测的集成式增量学习算法[J].北京工业大学学报,2020,46(11):1239-1245. 被引量：5

引证文献1

1赵鑫,刘玉,孔凡功,陈洪雷.数字化集成信息增量学习算法仿真研究[J].计算机仿真,2022,39(7):362-365.

1毛倩.基于互联网迭代思维的《财务报表分析》课程设计[J].现代科学仪器,2020(5):189-194.
2乔龙,陈德刚.大规模图顶点覆盖的增量算法研究[J].北京信息科技大学学报（自然科学版）,2020,35(5):51-56.
3杨繁隆,冯万平,杨顺为,林崇诚,陆欢.柱塞阀运动副高温时的间隙理论计算及有限元仿真分析[J].现代机械,2020(3):33-36. 被引量：2
4李洋,李大永.过m×n正方形网格格点的直线条数的探究[J].中学生数学,2020(19):32-34.
5李慧,胡旭东,宣文博.电力系统可靠性评估的重要抽样影响增量方法[J].电力系统及其自动化学报,2020,32(7):117-124. 被引量：11
6王建国,赵鹏飞,张文兴,秦波,刘文婧.多尺度高斯核支持向量机算法[J].机床与液压,2020,48(20):5-8. 被引量：4
7孙富春,杨超,荆明轩.动态场景下如何实现高效技能学习[J].前沿科学,2020,14(3):18-23. 被引量：1
8赵森,邓力华,陈芬.不同植物FERONIA基因密码子使用偏好性分析[J].江苏农业学报,2020,36(5):1073-1081. 被引量：4
9李颖洁,陈铭,陈黎,张兴,杨品,杨正华.激光聚变实验中诊断设备反馈控制瞄准技术[J].控制理论与应用,2020,37(10):2147-2154. 被引量：1
10程介虹,陈争光.改进的联合区间随机蛙跳算法的近红外光谱波长选择[J].光谱学与光谱分析,2020,40(11):3451-3456. 被引量：6

计算机科学与探索

2020年第11期

浏览历史

内容加载中请稍等...

最大化AUC的正例未标注分类及其增量算法被引量：1

参考文献1

二级参考文献2

共引文献5

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

最大化AUC的正例未标注分类及其增量算法 被引量：1

参考文献1

二级参考文献2

共引文献5

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

最大化AUC的正例未标注分类及其增量算法被引量：1