分类学习算法的性能度量指标综述被引量：22

Survey for Performance Measure Index of Classification Learning Algorithm

下载PDF

导出

摘要在机器学习的分类问题研究中,对分类学习算法的正确评价是非常重要的。现实中,许多性能度量指标被从不同的角度提出,文中主要介绍了基于错误率的、基于混淆矩阵的和基于统计显著性检验的三大类性能度量指标,详细地讨论了分类学习算法各性能度量指标的提出背景、意义以及适用范围,分析了各种性能度量之间的差异,提出和分析了各方法中有待进一步研究的问题和方向。进一步,通过实验数据横向(每类度量中各方法之间的类内差异)和纵向(3类度量之间的类间差异)对照了各性能度量指标之间的差异,分析了各性能度量指标在分类算法选择上的一致性。 In the research of classification task of machine learning,it is important for correctly evaluating the performance of the learning algorithm.In practical application,many performance measure indexes are proposed based on different perspectives.Three kinds of performance measure indexes based on error rate,confusion matrix and statistical test are introduced in this paper.The background,significance and scope of each measure index are discussed.The differences of different methods are analyzed.The future research problems and directions are also put forward and analyzed.Furthermore,the differences of these performance measure indexes are also compared by experimental data in portrait and landscape.The consistency of these performance measure indexes is also analyzed in classification algorithm selection.

作者杨杏丽 YANG Xing-li(School of Mathematical Sciences,Shanxi University,Taiyuan 030006,China;School of Computer and Information Technology,Shanxi University,Taiyuan 030006,China)

机构地区山西大学数学科学学院山西大学计算机与信息技术学院

出处《计算机科学》 CSCD 北大核心 2021年第8期209-219,共11页 Computer Science

基金国家自然科学基金(62076156,61806115) 山西省应用基础研究项目(201901D111034,201801D211002) 统计与数据科学前沿理论及应用教育部重点实验室开放研究课题(KLATASDS2007)。

关键词性能度量错误率混淆矩阵统计检验 Performance measure Error rate Confusion matrix Statistical test

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1杨柳,王钰.组块3×2交叉验证的F1度量的方差分析[J].计算机科学与探索,2016,10(8):1176-1183. 被引量：2
2刘焱青,王钰,李济洪.基于组块3×2交叉验证t检验的模型选择算法[J].陕西科技大学学报（自然科学版）,2015,35(1):179-183. 被引量：2

二级参考文献18

1Hastie T, Tibshrani R, Friedman J. The elements of statisticallearning: data mining, inference, and prediction[M].Berlin: Springer, 2001.
2Nadeau C, Bengio Y. Inference for the generalization error[J].Machine Learning, 2003, 52(3): 239-281.
3Bengio Y, Grandvalet Y. No unbiased estimator of varianceof K-fold cross validation[J]. Journal of Machine LearningResearch, 2004, 5: 1089-1105.
4Grandvalet Y, Bengio Y. Hypothesis testing for cross validation,Tech Rep 1285[R]. Montreal, Canada: University ofMontreal, 2006.
5Markatou M, Tian H, Biswas S, et al. Analysis of varianceof cross-validation estimators of the generalization error[J].Journal of Machine Learning Research, 2005, 6(7): 1127-1168.
6Diettetich T. Approximate statistical tests for comparing supervisedclassification learning algorithms[J]. Neural Computation,1998, 10(7): 1895-1924.
7Alpaydin E. Combined 5×2 cv F test for comparing supervisedclassification learning algorithms[J]. Neural Computation,1999, 11(8): 1885-1892.
8Yildiz O. Omnivariate rule induction using a novel pairwisestatistical test[J]. IEEE Transactions on Knowledge and DataEngineering, 2013, 25(9): 2105-2118.
9Wang Yu, Wang Ruibo, Jia Huichen, et al. Blocked 3 × 2cross- validated t- test for comparing supervised classificationlearning algorithms[J]. Neural Computation, 2014, 26(1): 208-235.
10Wang Yu, Li Jihong, Li Yanfang. Measure for data partitioningin m × 2 cross- validation[J]. Pattern Recognition Letters,2015, 65(11): 211-217.

共引文献2

1包志强,胡啸天,赵研,赵媛媛,黄琼丹.基于改进堆叠泛化算法的电信套餐预测[J].西安邮电大学学报,2019,24(2):98-104.
2宋毅君,王瑞波.汉语框架语义角色标注中特征模板选择法比较[J].山西大学学报（自然科学版）,2021,44(5):907-914.

同被引文献189

1杨金华,张焕芝.非常规、深层、海洋油气勘探开发技术展望[J].世界石油工业,2020,27(6):20-26. 被引量：12
2陈波,张华,汪双,王皓冉,刘昭伟,李永龙,谢辉.基于全卷积神经网络的坝面裂纹检测方法研究[J].水力发电学报,2020(7):52-60. 被引量：23
3吴迪,郭嗣琮.改进的Fisher Score特征选择方法及其应用[J].辽宁工程技术大学学报（自然科学版）,2019,38(5):472-479. 被引量：9
4李绍山.易读性研究概述[J].解放军外国语学院学报,2000,23(4):1-5. 被引量：96
5林英松,蒋金宝,秦涛.井漏处理技术的研究及发展[J].断块油气田,2005,12(2):4-7. 被引量：94
6闫明松,周志华.代价敏感分类算法的实验比较[J].模式识别与人工智能,2005,18(5):628-635. 被引量：14
7苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：378
8李闯,丁晓青,吴佑寿.一种改进的AdaBoost算法——AD AdaBoost[J].计算机学报,2007,30(1):103-109. 被引量：53
9刘秀娟,高抒,邹文,王西林.浅地层剖面仪SEGY型数据文件的读取[J].物探化探计算技术,2007,29(3):273-275. 被引量：12
10邢富坤,程东元,濮建忠.英文文本难度自动测量系统的研制与开发[J].现代教育技术,2008,18(6):79-85. 被引量：5

引证文献22

1李子言.大数据背景下ROC曲线介绍与应用[J].科教导刊,2021(14):81-84. 被引量：10
2胡梦琪,欧阳艾嘉,刘丽,赵丽丽.最优极限学习机入侵检测算法[J].福建电脑,2021,37(10):24-26. 被引量：2
3郭文强,赵艳,张栋,黄梓轩,侯勇严,肖秦琨,郭志高.基于贝叶斯网络建模的疼痛评估研究[J].陕西科技大学学报,2021,39(6):161-166. 被引量：3
4赵晓蕊,龙云,陈思齐,白洁,肖霄,朱社宁.妇科恶性肿瘤患者术后胃肠功能紊乱风险预测模型的构建及验证[J].护理学报,2022,29(3):72-78. 被引量：7
5王浩然,李廷会,曹玉军,黄飞江,李振彰.改进YOLOv5s网络在缺陷检测中的应用[J].网络新媒体技术,2022,11(2):58-65. 被引量：2
6赵昕航,丁堃,孙曰君,张春博,林原,高成锴.学术论文审稿效用研究——以国际会议ICLR同行评议为例[J].中国科技期刊研究,2022,33(3):296-304.
7刘韦辰,王雨彤,张达颖,胡茂荣,王志剑,宁玉梅,魏建梅.带状疱疹后神经痛病人负性情绪的影响因素分析[J].中国疼痛医学杂志,2022,28(7):545-548. 被引量：7
8马鑫程,宗在翔,贾旭.基于深度学习的浅地层剖面层界自动提取[J].海洋测绘,2022,42(5):27-31.
9郭文强,赵艳,徐紫薇,肖秦琨.基于多模态的贝叶斯网络疼痛识别方法[J].科学技术与工程,2022,22(28):12505-12511. 被引量：1
10郭文强,冯春石,赵艳,侯勇严,徐成,李惟.基于贝叶斯网和迁移学习的人脸表情识别方法[J].陕西科技大学学报,2022,40(6):163-169. 被引量：1

二级引证文献42

1郭瑜瑜,郭锦丽,刘芳,秦璐,周敏.妊娠晚期孕妇预警评分表在高危孕妇筛查中的再预测分析[J].护理研究,2022,36(9):1556-1560. 被引量：3
2种萌,牛亚芳,马鑫,马莉.初始血钾水平与急诊ICU脓毒症患者预后的关系[J].中国急救医学,2022,42(6):499-505. 被引量：5
3郭文强,冯春石,赵艳,侯勇严,徐成,李惟.基于贝叶斯网和迁移学习的人脸表情识别方法[J].陕西科技大学学报,2022,40(6):163-169. 被引量：1
4刘海龙,王成祥,孟战虎,康慧,王雨强,王星宇.基于JMP的AOI检测能力分析[J].科技创新与应用,2022,12(34):55-58.
5李学玲,樊竹青,罗银玲,孙体杰,王菲儿,许苑南.不同萃取相黄果茄果实乙醇提取物的生物活性比较分析[J].中国兽医杂志,2022,58(11):73-79.
6范彦勤,黄海午,杨智凯.基于特征工程和树增强贝叶斯网络的个人信用评估研究[J].桂林航天工业学院学报,2022,27(4):573-579. 被引量：2
7李高平,邱治邦,苗加庆,王静,任小洁,程日鑫.基于LSTM的空气质量预测模型[J].西南民族大学学报（自然科学版）,2023,49(1):67-73. 被引量：1
8王一一,李晓红,刘鹏,王雅辉,林学武.超声引导下椎旁神经阻滞联合利多卡因凝胶贴膏治疗带状疱疹后神经痛疗效观察[J].中华全科医学,2023,21(3):401-404. 被引量：6
9于红娟,张巍.培菲康在ICU危重病患者胃肠功能紊乱中的作用分析[J].中国实用医药,2023,18(5):35-38.
10龙凌,陈浩,梁昊,赵爽,刘钊,李兆彤.基于轻量化YOLO网络的实时X射线焊缝缺陷检测[J].网络新媒体技术,2023,12(2):30-38.

1黄傲,杨媚,肖德强,谭兴勇,羽焕坤,宋家乐.从田间到餐桌——广西儿童“食育”实践[J].广西教育,2021(21):10-12.
2王建新,宋晓星,颜青琪,曹将,裴晓苏.人群消费价值观评价模型分析[J].北京汽车,2021(3):50-54. 被引量：1
3王丽.未成年人适用保安处分概述[J].法制博览（名家讲坛、经典杂文）,2021(19):98-99.
4王栓虎,柳亚魁,时依,管佳佳,刘牧林.直肠前切除术后吻合口漏的危险因素分析[J].中华全科医学,2021,19(8):1277-1279. 被引量：2
5吴优,彭家清.人附睾蛋白4在肾脏病中的研究进展[J].世界最新医学信息文摘,2021(26):92-93.
6徐翔.社交网络内容生产中“标准偶像”现象与机理--基于潜在语义分析的微博文本挖掘[J].华南理工大学学报（社会科学版）,2021,23(4):109-121.
7武斌,谭卓英,李繁,王舜.方钢管混凝土极限黏结强度统一计算方法[J].混凝土,2021(7):130-134.
8刘瑶,李明,王润涛.基于高光谱图像和模式识别技术的重金属镉污染的菲律宾蛤仔检测[J].现代计算机,2021,27(19):99-104. 被引量：2
9李良琼,李春友,郑宇.煤炭采选业上市公司财务弹性偏序集评价研究[J].会计之友,2021(15):46-52. 被引量：1
10刘畅,阿布都克力木·阿布力孜,姚登峰,哈里旦木·阿布都克里木.维吾尔语形态分析研究综述[J].计算机工程与应用,2021,57(15):42-61. 被引量：3

计算机科学

2021年第8期

浏览历史

内容加载中请稍等...

分类学习算法的性能度量指标综述被引量：22

参考文献2

二级参考文献18

共引文献2

同被引文献189

引证文献22

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

分类学习算法的性能度量指标综述 被引量：22

参考文献2

二级参考文献18

共引文献2

同被引文献189

引证文献22

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

分类学习算法的性能度量指标综述被引量：22