基于混淆矩阵的分类器性能评价指标比较被引量：20

下载PDF

导出

摘要本文主要研究在模拟实验中,实验数据类别是平衡也即是训练的数据类别比例差别不大,实验结果关注的是正确率与错误率,但是随着实际问题的处理,如信用卡错误交易研究、疾病症断研究^([1]),实验结果更多关注的是数据集中其中少类的分类精度,而不是整体的分类情况,因此不平衡数据的分类问题^([2])评价成为了实验员的挑战。针对实际分类模型评价时,有以下几种方法:混淆矩阵(Confusion Matrix)、接受者操作特性曲线(ROC Chart)、收益图(Gain Chart)、提升图(Lift Chart)、KS图(KS Chart)。

作者赵存秀

机构地区山西工商学院

出处《电子技术与软件工程》 2020年第13期146-147,共2页 ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING

基金山西省教育教学“十三五”规划课题(GH-19157) 山西工商学院校级课题(JG201944)。

关键词混淆矩阵不平衡数据几种方法模拟实验分类模型实验员性能评价指标数据类别

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1张涛.不平衡数据分类研究及在疾病诊断中的应用[J].黄河科技学院学报,2019,21(5):15-22. 被引量：5
2李永新.一种不平衡数据的分类方法[J].兰州理工大学学报,2008,34(3):87-90. 被引量：3

二级参考文献7

1JAPKOWICZ N, STEPHEN S. The class imbalance problem: a systematic study [ J]. Intelligent Data Analysis, 2002, 6 ( 5 ) : 429-449.
2Proceedings of the Fourth International Conference on Knowledge Discovery and Data Ming [C]. New York: AAAI Press, 1998:73-79.
3CRISTIANINI N, SHAWE-TAYOR J. An introduction to support vector machines and other kernel-based learning methods [M]. Cambridge,Cambridge University Press, 2000.
4TAX D,DUIN R Support vector domain description [J]. Pattern Recognition Letters, 1999,20(11-13) : 1 191-1 199.
5WANG J, NESKOVIC P, COOPER L N. Pattern classification via single spheres [J]. Discovery Science (S0302-9743), 2005, 3735:241-252.
6BLAKE C L, MERZ C J. UCI repository of machine learning database [DB/OL]. [2007-05-21]. http://www, ics. uei. edu/-mleam/MLRepository. html.
7沈学华,周志华,吴建鑫,陈兆乾.Boosting和Bagging综述[J].计算机工程与应用,2000,36(12):31-32. 被引量：66

共引文献6

1陈寿文,李明东.一种混合均值聚类算法的实现[J].计算机工程与应用,2010,46(18):132-134. 被引量：3
2张灵婕,尤添革.基于R语言对不平衡数据分类的研究[J].福建电脑,2018,34(1):10-11. 被引量：1
3张德鑫,雒腾,曾志勇.基于改进的SMOTE采样Catboost分类算法[J].信息通信,2020,0(1):57-60. 被引量：2
4田波,沈江明,张德鑫,曾志勇.不平衡数据集的分类研究在医疗数据方面的应用[J].电子技术与软件工程,2020(9):170-171. 被引量：2
5张念蓬,吴旭,朱强.基于熵的过采样框架[J].计算机工程与应用,2021,57(13):96-101. 被引量：3
6邹琼,王冲.不平衡数据分类及在疾病诊断中的应用研究进展[J].职业与健康,2023,39(12):1719-1725.

同被引文献231

1武新丽,李柔,令狐大智.电子商务用户评价信息有效性研究——基于淘宝服装类商品[J].沿海企业与科技,2019,0(6):8-13. 被引量：4
2王瑞霞.基于RMF的成品油销售企业客户分类管理研究[J].现代营销（信息版）,2020(6):71-73. 被引量：1
3王钰,赵晓艳,杨杏丽,李济洪.基于K折交叉验证Beta分布的AUC度量的置信区间[J].系统科学与数学,2020,40(9):1564-1577. 被引量：12
4苏成林,郎垚,龚秋全,董武钟.引入SPP的高分辨率遥感影像深度学习分类方法[J].勘察科学技术,2021(4):20-24. 被引量：2
5万平,吴超仲,马晓凤.基于ROC曲线和驾驶行为特征的驾驶愤怒强度判别阈值[J].吉林大学学报（工学版）,2020,50(1):121-131. 被引量：8
6何江江,李孝全,赵玉伟,张保山,丁海斌.基于改进EEMD的卷积神经网络滚动轴承故障诊断[J].重庆大学学报（自然科学版）,2020,43(1):82-89. 被引量：7
7万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：58
8游星.ID3算法在网络商铺客户稳定性分析中的应用研究[J].广西质量监督导报,2020(10):196-197. 被引量：1
9马洪良,王春涛,陆江.基于热效率实验仪的热机模式最佳负载测量[J].物理实验,2004,24(8):26-27. 被引量：1
10陈斌,王豪,林松,赵杰文.基于相关系数法与遗传算法的啤酒酒精度近红外光谱分析[J].农业工程学报,2005,21(7):99-102. 被引量：49

引证文献20

1于天鑫,彭璇.基于机器学习高通量筛选吸附甲烷的金属有机框架材料[J].北京化工大学学报（自然科学版）,2021,48(2):100-107.
2于营,杨婷婷,杨博雄.混淆矩阵分类性能评价及Python实现[J].现代计算机,2021,27(20):70-73. 被引量：18
3王耀,张贵宇,刘文斌,罗琪,林椿松,庹先国.基于BP神经网络的白酒探汽上甑方法研究[J].食品科技,2022,47(1):99-106. 被引量：7
4陈晓,彭湃,李新,陈鹏.基于机器学习的商品虚假价格检测[J].信息技术与信息化,2022(2):214-217.
5杨迎港,刘培,张合兵,张文志.基于特征优选随机森林算法的GF-2影像分类[J].航天返回与遥感,2022,43(2):115-126. 被引量：13
6赵国兵,程吉,李洋,谢文瀚,邓立.基于高分1号和高分3号卫星影像的四川低山丘陵区不透水面提取[J].四川农业与农机,2022(3):40-44.
7王梦,张鸿鑫,刘庆华,张东.基于改进YOLOv5的幽门螺杆菌免疫印迹图像识别[J].计算机与现代化,2022(9):78-84.
8李珊珊,李兆玉,赖雪梅,陈虹羽.基于概率神经网络的增量式入侵检测方法[J].计算机仿真,2022,39(9):476-482. 被引量：2
9全泓达,盖磊.空气热机平衡点的快速判定方法[J].物理实验,2022,42(10):46-50.
10陈文悦,何军,朱立学,马稚昱,褚璇,刘洪利,韦鸿钰.基于迁移学习的芒果成熟度分类算法研究[J].仲恺农业工程学院学报,2022,35(4):56-61. 被引量：4

二级引证文献49

1潘俊虹,苏宁宁,廖晓莉,梁明.基于GF2号卫星遥感的闽北山区茶园提取对比研究[J].现代计算机,2021,27(33):77-81. 被引量：3
2王昊,马睿,原相杰,肖攀,刘燕萍,张富刚,高然.基于网络大数据的不动产统一登记制度实施状况分析[J].自然资源情报,2022(4):14-21. 被引量：2
3代希文,周犊,赵桂生,邵浙梁,于新海,周邵萍.基于阈值的电动调节阀故障检测方法研究[J].化工设备与管道,2022,59(3):73-79. 被引量：1
4林慧,张宿义,张炼,张立强,郑昌宁.现代检测技术在白酒自动化摘酒中的研究现状[J].食品与机械,2022,38(10):235-240. 被引量：3
5王钦炜,李璋,江云天,卞一杰,赵宏,叶熠彬.面向广域场景的可见光-SAR遥感图像匹配方法[J].航天返回与遥感,2022,43(5):109-122. 被引量：2
6梁超,刘建强,邹亚荣,张茜,崔松雪,杨典,朱丽英.基于RF模型的滨海城镇土地利用高分遥感提取分析--以江苏省连云港市赣榆区为例[J].地理信息世界,2022,29(5):106-111. 被引量：1
7王舜.CART决策树在旅游保险数据中的研究[J].软件,2022,43(10):122-124.
8梁成钢,李菊花,陈依伟,秦顺利,张金风,胡可.基于朴素贝叶斯算法评估页岩油藏产能[J].深圳大学学报（理工版）,2023,40(1):66-73. 被引量：1
9秦建楠,胡文斌,徐立.基于随机森林和神经网络的城市轨道交通列车速度预测算法[J].控制与信息技术,2022(6):62-68.
10李若琳,陈丽萍,姜红,杨俊,满吉.X射线荧光光谱结合支持向量机对眼药水塑料瓶的分类研究[J].上海塑料,2022,50(6):56-63. 被引量：2

1史炎,史天成.曲柄滑块拦阻器设计与动力学仿真[J].振动与冲击,2020,39(22):243-247.
2张欣,张怡(指导).含参单调费思量观察彻底显神通[J].中学生数学,2020(21):35-36.
3史二娜,肖蕾蕾,姬冠妮.基于信息融合的煤矿主通风机振动故障诊断方法[J].自动化与仪器仪表,2020(11):22-25.
4邵明超,宋宏利,尚明,何洪涛,史宜梦.多源土地覆被数据类别一致性及景观格局差异性——以京津冀区域为例[J].生态学杂志,2020,39(11):3881-3889. 被引量：9
5温全,李忠富,李州扬,张铎.BIM应用价值视角下绿色建筑环境性能评价方法研究[J].工程管理学报,2020,34(5):13-18. 被引量：9
6陈磊.企业集团财务共享服务的建设探讨[J].中国产经,2020(14):29-30.
7姚晓光,王燕.老化SBS改性沥青混合料再生方式及RS因子可行性研究[J].公路,2020,65(11):353-360. 被引量：3
8白宇琦,赵金辉,张奥兵,海涵.基于Aspen Plus的吸收式热泵性能指标影响因素研究[J].郑州大学学报（理学版）,2020,52(4):103-109. 被引量：1
9吴增源,周彩虹,刘畅,郑素丽.基于不平衡大数据的CS-AdaBoost-DT模型在家电产品质检中的应用[J].工业工程与管理,2020,25(5):42-49. 被引量：8
10肖江波,石中华.子痫前期尿蛋白/肌酐比值与尿蛋白定性及定量的相关性分析[J].中国临床医生杂志,2020,48(12):1483-1485. 被引量：6

电子技术与软件工程

2020年第13期

浏览历史

内容加载中请稍等...

基于混淆矩阵的分类器性能评价指标比较被引量：20

参考文献2

二级参考文献7

共引文献6

同被引文献231

引证文献20

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基于混淆矩阵的分类器性能评价指标比较 被引量：20

参考文献2

二级参考文献7

共引文献6

同被引文献231

引证文献20

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基于混淆矩阵的分类器性能评价指标比较被引量：20