摘要
本文主要研究在模拟实验中,实验数据类别是平衡也即是训练的数据类别比例差别不大,实验结果关注的是正确率与错误率,但是随着实际问题的处理,如信用卡错误交易研究、疾病症断研究^([1]),实验结果更多关注的是数据集中其中少类的分类精度,而不是整体的分类情况,因此不平衡数据的分类问题^([2])评价成为了实验员的挑战。针对实际分类模型评价时,有以下几种方法:混淆矩阵(Confusion Matrix)、接受者操作特性曲线(ROC Chart)、收益图(Gain Chart)、提升图(Lift Chart)、KS图(KS Chart)。
出处
《电子技术与软件工程》
2020年第13期146-147,共2页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
基金
山西省教育教学“十三五”规划课题(GH-19157)
山西工商学院校级课题(JG201944)。