-
题名合成少数类过采样过滤器方法在二手车推荐中的应用
被引量:1
- 1
-
-
作者
邱海波
钱忠民
钱默抒
-
机构
南京航空航天大学计算机科学与技术学院
南京航空航天大学无人机研究院
-
出处
《计算机与现代化》
2016年第7期118-123,共6页
-
基金
国家自然科学基金资助项目(61403195)
江苏省自然科学基金资助项目(SBK2014042586)
-
文摘
由于二手车推荐的数据集具有非平衡特性,因此,二手车推荐可视为非平衡分类问题,可借助解决非平衡分类问题的方法来实现二手车推荐。本文对非平衡数据分类的数据集重构进行研究,通过分析合成少数类过采样方法(Synthetic Minority Over-sampling Technique,SMOTE)的特点与不足,提出合成少数类过采样过滤器方法 (Synthetic Minority Oversampling Technique Filter,Smote Filter),对SMOTE方法合成样本进行过滤,减少合成样本中的噪声数据,提高训练样本"质量"。使用支持向量机对SMOTE合成的数据和Smote Filter合成的数据进行实验对比,结果表明Smote Filter方法相较传统的SMOTE过采样方法,提高了二手车推荐中少数类的预测精度,提升了对二手车推荐的整体预测性能。
-
关键词
二手车推荐
分类
非平衡数据
过采样
支持向量机
-
Keywords
used-car recommendation
classification
imbalanced dataset
over-sampling
support vector machine
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-