代价敏感学习中的损失函数设计被引量：15

Design of loss function for cost-sensitive learning

下载PDF

导出

摘要一般的学习算法通过最小化分类损失使分类错误率最小化,而代价敏感学习则以最小化分类代价为目标,需构造代价敏感损失.本文探讨代价敏感损失的设计准则,首先介绍基于代价敏感风险优化的代价敏感学习方法,然后在Bayes最优分类理论框架下,提出两条代价敏感损失设计准则.接着采用两种常用代价敏感损失生成方法构造平方损失、指数损失、对数损失、支持向量机损失等经典损失函数的代价敏感扩展形式.根据所提出的设计准则,从理论上分析这些代价敏感损失的性能.最后通过实验表明,同时满足两条设计准则的代价敏感损失能有效降低分类代价,从而证明了本文提出的代价敏感损失设计准则的合理性. Conventional learning algorithms minimize the classification error through minimizing the classification loss. However, the cost-sensitive learning minimizes the classification cost; thus, cost-sensitive losses have to be constructed. This paper studies the design criteria for cost-sensitive loss functions. Firstly, cost-sensitive learning methods based on cost-sensitive risk minimization are briefly introduced. Then, under the theory framework of Bayes optimal classification, two design guidelines of cost-sensitive loss function are proposed. The cost-sensitive extensions of several classic loss functions （e.g., square loss, exponential loss, log loss and support vector machine （SVM） loss） are generated via two most popular construction methods of cost-sensitive loss. The performances of these cost-sensitive losses are theoretically analyzed based on the proposed two design guidelines. Experimental results have shown that those cost-sensitive losses that satisfy both of the two design criteria significantly reduce classification costs, demonstrating the rationality of the proposed design criteria of cost-sensitive loss.

作者李秋洁赵亚琴顾洲

机构地区南京林业大学机械电子工程学院东南大学自动化学院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2015年第5期689-694,共6页 Control Theory & Applications

基金国家自然科学青年基金项目(31200496 61473156) 中国博士后基金项目(2014M551487) 江苏省博士后基金项目(1301009A)资助~~

关键词学习算法代价敏感学习损失函数 Bayes最优决策代价敏感损失 learning algorithms cost-sensitive learning loss function Bayes optimal decision cost-sensitive risk

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1ZHOU Z Z. Cost-sensitive learning [C] //Modeling Decision for Artificial Intelligence Lecture Notes in Computer Science. Berlin: Springer, 2011, 6820:17 - 18.
2SAHIN Y, BULKAN S, DUMAN E. A cost-sensitive decision tree approach for fraud detection [J]. Expert Systems with Applications, 2013, 40(15): 5916 - 5923.
3LU S J, LIU L, LU Y, et al. Cost-sensitive neural network classifiers for postcode recognition [J]. International Journal of Pattern Recog- nition and Artificial Intelligence, 2012, 26(5): 1 - 14.
4CAO E ZHAO D Z, ZAIANE O. A PSO-based cost-sensitive neural network for imbalanced data classification [C] I/Trerzds and Appli- cations in Knowledge Discovery and Data Mining Lecture Notes in Computer Science. Berlin: Springer, 2013, 7867:452 - 463.
5CAO E ZHAO D Z, ZAIANE O. An optimized cost-sensitive SVM for imbalanced data learning [C] //Advances in Knowledge Discov- ery and Data Mining Lecture Notes in Computer Science. Berlin: Springer, 2013, 7819: 280- 292.
6LOZANO A C, ABE N. Multi-class cost-sensitive boosting with p- norm loss functions [C]//Proceeding of the 14th ACM SIGKDD In- ternational Conference on Knowledge Discovery and Data Mining. New York: ACM, 2008:506 - 514.
7MASNADI-SHIRAZI H, VASCONCELOS N. Cost-sensitive boost- ing [J]. Pattern Analysis and Machine Intelligence, 2010, 33(2): 294 - 309.
8付忠良.多分类问题代价敏感AdaBoost算法[J].自动化学报,2011,37(8):973-983. 被引量：32
9李秋洁,茅耀斌,叶曙光,王执铨.代价敏感Boosting算法研究[J].南京理工大学学报,2013,37(1):19-24. 被引量：3
10韩敏,穆大芸.基于Adaboost算法的回声状态网络预报器[J].控制理论与应用,2011,28(4):601-604. 被引量：8

二级参考文献22

1涂承胜,陆玉昌.Boosting视角[J].计算机科学,2005,32(5):140-143. 被引量：2
2闫明松,周志华.代价敏感分类算法的实验比较[J].模式识别与人工智能,2005,18(5):628-635. 被引量：14
3凌晓峰,SHENG Victor S..代价敏感分类器的比较研究(英文)[J].计算机学报,2007,30(8):1203-1212. 被引量：35
4HORNIK K, STINCHCOMBE M, WHITE H. Multi-layer feed-forward networks are universal approximators[J]. Neural Networks, 1989, 2(3): 359 - 366.
5CAI X D. Time series prediction with recurrent neural networks trained by a hybrid PSO-EA algorithm[J]. Neurocomputing, 2007, 70(13/15): 2342 - 2353.
6JAEGER H, HAAS H. Harnessing nonlinearity: predicting chaotic systems and saving energy in wireless communication[J]. Science, 2004, 304(5667): 78 - 80.
7LIN X W, YANG Z H, SONG Y X. Short-term stock price prediction based on echo state networks[J]. Expert Systems with Applications, 2009, 36(3): 7313 - 7317.
8GE Q, WEI C J. Multiresolution-based echo state network and its application to the longterm prediction of network traffic[C]//2008 International Symposium on Computational Intelligence and Design. Piscataway, N J: IEEE, 2008, 1 : 469 - 472.
9SHI Z W, HAN M. Support vector echo state machine for chaotic time series prediction[J]. IEEE Transactions on Neural Networks, 2007, 18(2): 359 - 372.
10FREUND Y, SCHAPIRE R E. A decision-theoretic generalization of on-line learning and an application to boosting[J]. Journal of Computer and System Sciences, 1997, 55(1): 119 - 139.

共引文献40

1付忠良.一种用于方向预测的集成学习算法[J].上海交通大学学报,2012,46(2):250-258. 被引量：2
2董元元,陈基漓,唐小侠.基于BP_Adaboost的文本分类研究[J].网络安全技术与应用,2012(3):42-43. 被引量：3
3HU Bao-Gang,HE Ran,YUAN Xiao-Tong.Information-theoretic Measures for Objective Evaluation of Classifications[J].自动化学报,2012,38(7):1169-1182. 被引量：1
4雷蕾,王晓丹.基于损失函数的AdaBoost改进算法[J].计算机应用,2012,32(10):2916-2919. 被引量：2
5何智翔,丁晓青,方驰,文迪.基于可控风险敏感AdaBoost算法的人脸检测[J].清华大学学报（自然科学版）,2012,52(12):1703-1708. 被引量：2
6付忠良.通用集成学习算法的构造[J].计算机研究与发展,2013,50(4):861-872. 被引量：13
7任志博,王莉莉,付忠良,张丹普,杨燕霞.基于Ranking Loss的多标签分类集成学习算法[J].计算机应用,2013,33(A01):40-42. 被引量：1
8薄迎春,乔俊飞.启发式动态规划在污水处理过程控制中的应用[J].控制理论与应用,2013,30(7):828-833. 被引量：6
9李秋洁,茅耀斌.基于数据重平衡的AUC优化Boosting算法[J].自动化学报,2013,39(9):1467-1475. 被引量：8
10刘国海,肖夏宏,江辉,梅从立,丁煜函.基于BP-Adaboost的近红外光谱检测固态发酵过程pH值[J].江苏大学学报（自然科学版）,2013,34(5):574-578. 被引量：4

同被引文献105

1郑恩辉,李平,宋执环.代价敏感支持向量机[J].控制与决策,2006,21(4):473-476. 被引量：33
2胡正平,张晔.结构风险最小化近邻分析解决大规模训练集支持向量机学习问题[J].信号处理,2007,23(2):161-164. 被引量：3
3杨俊燕,张优云,朱永生.ε不敏感损失函数支持向量机分类性能研究[J].西安交通大学学报,2007,41(11):1315-1320. 被引量：17
4Vapnik V. Statistical learning theory, Second Edition [M]. New York: Springer, 2001.
5Manel M R,Christos C. Support vector array processing [C]. Proceedings of the IEEE International Symposium on Antennas and Propagation Society, 2006.
6Manel M-R,Jose Luis R-A,Gustavo C-V,et al. Kernel antenna array processing [J]. IEEE Transactions on Antennasand Propagation, 2007,55 (3):642-650.
7Martfnez Ram6n M,Xu N,Christodoulou C G. Beamforming using support vector machines[J]. IEEE Transactions on Antennas and Wireless Propagation Letters, 2005(4):439--442.
8Debasish B,Srimanta P, Dipak C P. Support vector regression [J]. Neural Information Processing-Letters and Reviews, 2007,11 (10) :203-224.
9Gretton A, Herbrich R, Smola A. The kernel mutual infor- mation [R]. Max Planck Institute for Biological Cybernetics, Technical Report, Tuebingen, Germany,2003.
10Vapnik V. Statistical learning theory[M]. 2nd ed. New York:Springer,2001.

引证文献15

1林关成.基于支持向量机的阵列波束优化实验研究[J].电子设计工程,2016,24(10):5-8.
2林关成.基于标准支持向量回归的阵列波束优化研究[J].河南科学,2016,34(6):845-851.
3林关成.阵列波束优化的标准支持向量回归[J].西安工程大学学报,2016,30(5):681-688. 被引量：1
4赵新斌,李斌.民用飞机着陆垂直加速度标准的优化模型[J].沈阳师范大学学报（自然科学版）,2017,35(1):61-67. 被引量：3
5翟夕阳,王晓丹,李睿,贾琪.采用多类代价指数损失函数的代价敏感AdaBoost算法[J].西安交通大学学报,2017,51(8):33-39. 被引量：2
6王嘉强,范延滨.基于LSTM模型的人体情景多标签识别研究[J].青岛大学学报（工程技术版）,2018,33(4):40-44. 被引量：1
7吴雨茜,王俊丽,杨丽,余淼淼.代价敏感深度学习方法研究综述[J].计算机科学,2019,46(5):1-12. 被引量：20
8郭冰楠,吴广潮.基于改进的代价敏感决策树的网络贷款分类[J].计算机应用,2019,39(10):2888-2892. 被引量：5
9吴增源,周彩虹,刘畅,郑素丽.基于不平衡大数据的CS-AdaBoost-DT模型在家电产品质检中的应用[J].工业工程与管理,2020,25(5):42-49. 被引量：9
10王超发,王树斌,王成军.考虑分类代价的用户换手机的分类器研究——基于数据平衡性视角[J].管理评论,2021,33(9):177-186.

二级引证文献47

1郝春冬,昌飞,石兴.基于滤波器技术的加速度传感器测量位移的分析与设计[J].电子技术（上海）,2021,50(2):16-18. 被引量：3
2石梦鑫,智佳,高翔,杨甲森.基于集成学习的遥测数据互相关结构知识发现[J].北京航空航天大学学报,2020,46(1):181-188. 被引量：3
3姜齐艳,王鲁平.基于数据挖掘与神经网络的财务异常数据监测分析算法[J].电子设计工程,2020,28(11):14-17. 被引量：9
4董薇,张韶.基于人脸识别的学生安全预警系统设计[J].电子设计工程,2020,28(14):180-184. 被引量：5
5毛俊杰,李昌锋,祝和意,吕泊怡.基于数据挖掘与智能算法的学生心理状态预警系统设计[J].电子设计工程,2020,28(15):52-56. 被引量：5
6张立静,盛戈皞,江秀臣.泛在电力物联网在变电站的应用分析与研究展望[J].高压电器,2020,56(9):1-10. 被引量：32
7吴增源,周彩虹,刘畅,郑素丽.基于不平衡大数据的CS-AdaBoost-DT模型在家电产品质检中的应用[J].工业工程与管理,2020,25(5):42-49. 被引量：9
8刘金平,周嘉铭,贺俊宾,唐朝晖,徐鹏飞,张国勇.面向不均衡数据的融合谱聚类的自适应过采样法[J].智能系统学报,2020,15(4):732-739. 被引量：8
9吴晓倩,权丽丽,陈诚,石磊.基于大数据决策树算法的学生成绩分析与预测模型仿真[J].电子设计工程,2020,28(24):138-141. 被引量：13
10夏烨,雷晓鸣,王鹏,孙利民.针对网级评估的区域桥梁退化建模与演绎应用[J].中南大学学报（自然科学版）,2021,52(3):828-838. 被引量：4

1赵悦,穆志纯,李霞丽,潘秀琴.一种基于EM和分类损失的半监督主动DBN学习算法[J].小型微型计算机系统,2007,28(4):656-660. 被引量：2
2高妍方,赵青松,陈英武.基于代价敏感贝叶斯网络的烟叶感官质量评价[J].计算机工程,2008,34(21):187-189. 被引量：1
3宫秀军,孙建平,史忠植.主动贝叶斯网络分类器[J].计算机研究与发展,2002,39(5):574-579. 被引量：37
4张燕平,邹慧锦,赵姝.基于CCA的代价敏感三支决策模型[J].南京大学学报（自然科学版）,2015,51(2):447-452. 被引量：11
5李秋洁,茅耀斌,王执铨.基于Boosting的不平衡数据分类算法研究[J].计算机科学,2011,38(12):224-228. 被引量：17
6余承依.基于贝叶斯增量分类的邮件过滤研究[J].科学技术与工程,2009,9(9):2356-2361. 被引量：1
7金广智,石林锁,牟伟杰,刘浩,司海峰.基于偏最小二乘特征表示与分类的联合优化目标跟踪[J].光电子．激光,2016,27(2):203-209. 被引量：1
8金广智,石林锁,刘浩,牟伟杰,蔡艳平.结合PLS表示与随机梯度的目标优化跟踪[J].电子与信息学报,2016,38(8):2027-2032.
9覃新贤,谢应科,韩承德.GPS微弱信号C／A码捕获的最佳路径搜索算法[J].计算机研究与发展,2008,45(8):1423-1429. 被引量：4
10李双程.基于生物进化理论的人因系统风险演化研究[J].科技资讯,2013,11(20):216-217.

控制理论与应用

2015年第5期

浏览历史

内容加载中请稍等...

代价敏感学习中的损失函数设计被引量：15

参考文献14

二级参考文献22

共引文献40

同被引文献105

引证文献15

二级引证文献47

相关作者

相关机构

相关主题

浏览历史

代价敏感学习中的损失函数设计 被引量：15

参考文献14

二级参考文献22

共引文献40

同被引文献105

引证文献15

二级引证文献47

相关作者

相关机构

相关主题

浏览历史

代价敏感学习中的损失函数设计被引量：15