期刊文献+

基于机器学习算法的车险客户续保意向研究 被引量:1

下载PDF
导出
摘要 介绍了应用随机森林等机器学习算法预测家庭自用汽车保险客户续保意向的数据挖掘过程,包括数据采集和预测模型的建立、评估和优化。使用了具有K均值聚类的下采样方法处理不平衡数据,利用了模拟退火算法创建优化的决策树集。结果显示,不平衡数据经处理后建立的随机森林模型对正负类的预测正确率的几何平均值提高了56%,经优化后的模型对正负类的预测正确率都达60%以上,并且负类预测正确率大于正类预测正确率。同时,模型还给出分类概率,提出利用分类概率提前识别忠实客户、流水客户和摇摆客户并有针对性开展续保工作的方法。
作者 李笃群 LI Duqun
出处 《信息技术与信息化》 2021年第10期211-213,共3页 Information Technology and Informatization
  • 相关文献

参考文献1

二级参考文献6

  • 1Yang J,Yu X,Xie Z Q.A novel virtual sample generationmethod based on Gaussian distribution.Knowledge-BasedSystems[J].2011,24(6):740-748.
  • 2Gustavo E A,Batista P A,Ronaldo C,et al.A study ofthe behavior of several methods for balancing machinelearning training data.SIGKDD Explorations[J].2004,6(1):20-29.
  • 3Drummond C,Holte R C.C4.5,class imbalance,and costsensitivity:why under-sampling beats over-sampling[C]//.International Conference on Machine Learning.Washing-ton DC,2003:152-154.
  • 4Japkow Iczn,Stephen S.The class imbalance problem:asystematic study.Intelligent Data Analysis Journal[J].2002,6(5):429-450.
  • 5Kohavi R.A study of cross-validation and bootstrap foraccuracy estimation and model selection[C]//.Wermter S,Riloff E,Scheler G,eds.Proc.14th Joint Int.Conf.Artifi-cial Intelligence.San Mateo,CA:Morgan Kaufmann,1995:1137-1145.
  • 6张菊.改进的K-均值聚类算法图像边缘检测研究[J].科技通报,2012,28(6):47-48. 被引量:2

共引文献2

同被引文献1

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部