期刊文献+

一种网络广告点击欺诈检测的SVM集成方法 被引量:4

Application of SVM Ensemble Method to Click Fraud Detection
下载PDF
导出
摘要 针对以套取广告费为目的、实施恶意点击欺诈的不法发布商检测问题,提出一种基于支持向量机(Support Vector Machine,SVM)集成方法的点击欺诈检测系统.该系统首先对几百万条原始点击数据进行一系列数据清洗、整理和统计特征计算等数据预处理,之后利用随机欠抽样(RUS)与合成少数类过抽样技术(SMOTE)相结合的方法处理非平衡数据集得到多个平衡数据集,在每个平衡数据集上分别利用Boosting算法对训练得到基支持向量机迭代生成多个强分类器模型,最后再将多个强分类器以投票方式进行集成得到最终的检测模型.在真实点击数据上完成对广告发布商的点击欺诈检测,实验结果表明,该方法对点击欺诈有良好的检测性能,其检测准确度在90%以上. To solve the click fraud problem of online advertising industry,this paper proposes a boosting-based SVM ensemble method to detect fraudulent publishers. We implement the data pre-processing on more than millions of clicks efficiently and introduce random under sampling and SMOTE to handle skewed datasets. Then we generate multiple SVM ensemble models based on boosting by multiple balanced datasets. Finally multiple SVM ensemble models are combined by voting to detect fraudulent publishers. The final results showed that we successfully detected most fraud actions with the accuracy over 90%,which indicated that the method would maybe a possible solution.
作者 张欣 刘学军 李斌 郭汉 ZHANG Xin;LIU Xue-jun;LI Bin;GUO Han(College of Computer Science and Technology, Nanjing Tech University, Nanjing 211816, China })
出处 《小型微型计算机系统》 CSCD 北大核心 2018年第5期951-956,共6页 Journal of Chinese Computer Systems
基金 江苏省重点研发计划(社会发展)项目(BE2015697)资助 国家自然科学基金项目(61203072)资助
关键词 点击欺诈 集成方法 数据预处理 非平衡 BOOSTING click fraud ensemble method data pre-processing imbalanced Boosting
  • 相关文献

参考文献5

二级参考文献52

共引文献52

同被引文献24

引证文献4

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部