Bagging集成方法在保险欺诈识别中的应用研究被引量：12

Insurance Fraud Detection Based on Bagging Ensemble Learning

导出

摘要保险欺诈不仅危及保险公司的正常经营,增加投保人的负担,甚至有可能影响到国家的金融稳定。随着大数据时代的到来,保险反欺诈亟需引入革命性技术。Bagging集成方法以其可调节模型结构、易于部署、参数空间可控、支持并行运算等特点成为保险公司进行保险反欺诈一个好的选择。Bagging方法主要包括Bagging算法、Random Subspace算法、Random Patches算法,它们又能与不同基学习器结合构成新的分支算法及算法特例。本文基于这些算法对保险欺诈问题进行了实证检验,分析了各算法及与基学习器的适用性问题,以及基学习器个数对算法表现的影响。分析发现:针对保险欺诈识别问题,在Bagging、Random Subspace、Random Patches三者之中,Random Patches算法的表现最好,Bagging的运行时间最短;不同算法适用的基学习器不同,但总体来说最适合Bagging集成方法的是决策树;基于决策树的方法都一致选择是否委托律师代理作为最重要的特征;基学习器个数对不同Bagging算法表现的影响并不一致。 Insurance fraud not only jeopardizes the normal operation of insurance companies, but also increases the burden on policyholders,and may even affect Chinas financial stability. With the advent of the era of big data,it is necessary to introduce revolutionary technology for insurance fraud detection. The Bagging ensemble method has become an optimal choice because it's easy to adjust the model structure according to the amount of data,easy to deploy, controllable parameter space,and support for parallel computing. The Bagging methodology mainly comprises Bagging algorithm, Random Subspace algorithm, and Random Patches algorithm, and they can be combined with other base learners to form new branch algorithms and algorithm examples. Based on these algorithms, the paper conducted empirical testing on insurance frauds, the applicability of various algorithms and base learners, and the impacts of the number of base learners on the performance of algorithms. It was found that,for insurance fraud detection, the Random Patches algorithm had the highest score and the Bagging had the shortest running time among the Bagging, Random Subspace and Random Patches. Different algorithm should apply different base learner, but in general, among various base learners,the best was decision tree for the Bagging ensemble method. The most important feature of the decision tree method was whether to entrust a lawyer. The number of base learners had different effects on the performance of different algorithms.

作者李秀芳黄志国陈孝伟 LI Xiu-fang;HUANG Zhi-guo;CHEN Xiao-wei

机构地区南开大学金融学院

出处《保险研究》 CSSCI 北大核心 2019年第4期66-84,共19页 Insurance Studies

基金国家自然科学基金面上项目“保险公司经济资本预测与最优配置问题研究”(NO.71573143) “不确定全面风险分析框架下供应链风险建模与优化研究”(NO.61673225) 中央高校基本科研业务费专项资金“随机最优控制与金融保险管理交叉研究”(NO.63185019)的资助

关键词 BAGGING 保险欺诈极端随机树随机森林 Bagging insurance fraud Extremely Randomized Trees Random Forest

分类号 F84 [经济管理—保险] G623 [文化科学—教育学]

引文网络
相关文献

参考文献7

1李连友,林源.新型农村合作医疗保险欺诈风险度量实证研究[J].中国软科学,2011(9):84-93. 被引量：12
2林源,李连友.基于PSD-LDA模型的新农合欺诈风险测度实证研究[J].财经理论与实践,2014,35(5):18-23. 被引量：7
3刘崇,祝锡永.基于BP神经网络的医保欺诈识别[J].计算机系统应用,2018,27(6):34-39. 被引量：4
4刘坤坤.车险保险欺诈识别和测量模型实证研究——基于广东省车险历史索赔数据[J].暨南学报（哲学社会科学版）,2012,34(8):89-93. 被引量：8
5闫春,李亚琪,孙海棠.基于蚁群算法优化随机森林模型的汽车保险欺诈识别研究[J].保险研究,2017(6):114-127. 被引量：15
6叶明华.基于BP神经网络的保险欺诈识别研究——以中国机动车保险索赔为例[J].保险研究,2011(3):79-86. 被引量：26
7喻炜,冯根福,张文珺.机动车辆保险欺诈检测系统及团伙识别研究[J].保险研究,2017(2):63-73. 被引量：14

二级参考文献70

1樊欣,杨晓光.我国银行业操作风险的蒙特卡罗模拟估计[J].系统工程理论与实践,2005,25(5):12-19. 被引量：49
2沈利生,王恒.授信风险限额的人工神经网络模型检验[J].数量经济技术经济研究,2007,24(3):108-117. 被引量：6
3黄惠敏.广东保监局:保险欺诈现象逐年上升[N].每日经济新闻,2009-07-07.
4Art'1s, M. , M. Ayuso, and M. Guill'en, "Detection of Automobile Insurance Fraud with Discrete Choice Mod- els and Misclassified Claims" ,Journal of Risk and Insurance,2002,69:325 -340.
5Art'l s, M. , M. Ayuso, and M. Guill'en, "Modeling Different Types of Automobile Insurance Fraud Behaviors in the Spanish Market", Insurance : Mathematics and Economics, 1999,24:67 - 81.
6Bachir Belhadji and Georges Dionne, "Development of the Expert System for the Automatic Detection of Au- tomobile Insurance Fraud" ,Journal of Risk and Insurance, 1997.
7He H, Wang J, Graco W, Hawkins S, "Application of Neural Networks to Detection of Medical Fraud", Expert System Application, 1997,13:329 - 336.
8Insurance Bureau of Canada, Facts of the General Insurance Industry in Canada, 34th Edition, 2009, ISS- BN119734014.
9Jing Li, Kuei-Ying Huang, Jionghua Jin and Jianjun Shi,"A Survey on Statistical Methods for Health Care Fraud Detection", Health Care Manage ,2008,11:275 - 287.
10Michael L. Smith and Stephen A, Buyer Risk Aversion, Insurance Costs and Optimal Property-Lability Cover- age, June 1987, v. 54, ISS. 2, pp. 226 - 245 AN :0213140.

共引文献58

1潘爽,魏建国.基于KNMF-Bayesian-Xgboost算法的P2P网贷借款人信用评价[J].武汉理工大学学报,2019,41(2):93-98.
2徐成伟.基于贝叶斯优化Xgboost的车险欺诈识别研究[J].新一代信息技术,2022,5(5):49-52.
3张艺璐.基于新农合保险基金运行浅析保险欺诈问题的成因及对策[J].赤峰学院学报（哲学社会科学版）,2013,34(7):107-109.
4刘喜华,魏超.我国社会医疗保险欺诈研究综述[J].东方论坛（青岛大学学报）,2013(6):15-19. 被引量：4
5周建涛,周建波,秦炳山,徐迎迎.投保方欺诈还是保险公司惜赔[J].河北经贸大学学报,2014,35(2):115-120.
6林源,李连友.基于PSD-LDA模型的新农合欺诈风险测度实证研究[J].财经理论与实践,2014,35(5):18-23. 被引量：7
7范广哲,刘瑾雯.非平衡大数据下的保险欺诈识别研究[J].中国新通信,2015,17(1):98-99.
8林源,李连友.中国商业财产保险欺诈损失度量实证研究[J].系统工程学报,2015,30(4):509-518. 被引量：4
9阳义南,肖建华.医疗保险基金欺诈骗保及反欺诈研究[J].北京航空航天大学学报（社会科学版）,2019,32(2):41-51. 被引量：23
10张金霞.我国医保欺诈问题的风险防范及管理对策研究[J].商,2016,0(17):179-180.

同被引文献105

1刘轶,董敏.区块链赋能下保险欺诈规制的路径优化[J].江淮论坛,2022(4):69-74. 被引量：5
2李玉泉,乔石.保险欺诈主体的构成与法律责任[J].保险研究,2021(11):105-114. 被引量：3
3程振源.保险欺诈的博弈分析与最优保险契约的设计——以夸大保险事故损失为例[J].中国管理科学,2007,15(z1):305-309. 被引量：2
4叶正祥,秦诗立.保险欺诈行为的博弈分析[J].商业研究,2002(13):8-11. 被引量：1
5刘喜华,金加林,吴育华.夸大风险损失索赔欺诈博弈问题[J].系统工程理论方法应用,2004,13(3):229-233. 被引量：5
6边文霞.医疗保险欺诈信号传递博弈分析[J].首都经济贸易大学学报,2004,6(5):69-72. 被引量：12
7樊启荣.保险事故与被保险人过错之关系及其法律调整模式——兼评我国《保险法》第27条第2款及相关规定[J].法学评论,2002,20(5):43-51. 被引量：14
8韩玲.保险诈骗罪中几种特殊行为方式的司法认定[J].政治与法律,2005(4):114-118. 被引量：5
9陈辉金,韩元杰.数据挖掘和信息融合在保险业欺诈识别中的应用[J].计算机与现代化,2005(9):110-112. 被引量：5
10徐志军,张传伟.欺诈的界分[J].政法论坛,2006,24(4):91-99. 被引量：28

引证文献12

1李平,周俊明,来纯晓,李艳翠,司马笑莹.基于随机森林的无线信号弱覆盖识别率预测[J].电信快报,2021(6):41-46. 被引量：1
2徐成伟.基于贝叶斯优化Xgboost的车险欺诈识别研究[J].新一代信息技术,2022,5(5):49-52.
3董敏,吕红平,刘轶.人工智能反保险欺诈的私法效果和路径选择[J].金融教育研究,2019,32(6):12-20. 被引量：2
4张巍巍,吴恒亮.大数据技术在财产保险反欺诈中的应用研究综述[J].中国管理信息化,2021,24(15):143-145. 被引量：3
5罗琰,许莉.情绪能影响农业保险欺诈行为吗?——基于审计博弈的研究视角[J].财经理论与实践,2022,43(3):34-41. 被引量：2
6闫春,迟萧颖,刘新红.基于改进PSO-TSFNN的汽车保险欺诈检测模型[J].计算机仿真,2022,39(7):168-173. 被引量：1
7陈铭豪,曹斯蔚.大数据时代的我国人身保险业务反欺诈机制创新研究[J].保险职业学院学报,2022,36(5):75-83. 被引量：3
8陈凯,李斌杰.主流机器学习方法识别车险欺诈效果的比较研究[J].保险研究,2022(12):90-102. 被引量：3
9潘煜瞳,叶诗妤,黄旭.人工智能有效防范健康险欺诈的博弈分析[J].甘肃金融,2023(4):56-64. 被引量：1
10周建涛,杜景龙,周建波,徐白凡,张睿.机动车三责险人伤索赔经济、非经济损失夸大程度估计——基于理赔诉讼样本[J].保险研究,2023(7):17-33.

二级引证文献15

1刘轶,董敏.区块链赋能下保险欺诈规制的路径优化[J].江淮论坛,2022(4):69-74. 被引量：5
2周晓楠,黄磊,王飞跃,储明,黄涛.图数据库在识别重大疾病保险团伙式欺诈中的应用研究[J].保险研究,2020(9):92-104. 被引量：6
3陈铭豪,曹斯蔚.大数据时代的我国人身保险业务反欺诈机制创新研究[J].保险职业学院学报,2022,36(5):75-83. 被引量：3
4汪万敏,智路平.基于ADASYN-SFS-RF的欺诈检测模型泛化性能提升及可解释性研究[J].计算机应用研究,2022,39(12):3605-3613. 被引量：1
5谢探阳,李玉梅,张涛,高天亮,石玉超.基于DC-RRF的手眼标定优化算法[J].组合机床与自动化加工技术,2023(2):37-40.
6吴倩.基于大数据挖掘的保险反欺诈工作存在的问题及改进建议[J].保险职业学院学报,2023,37(1):67-69. 被引量：1
7周建涛,张睿,周建波.保险索赔机会欺诈识别研究——基于汽车三责险人伤夸大索赔的样本[J].河北经贸大学学报,2023,44(3):89-101.
8刘莹,锁凌燕.基于机器学习方法的商业医疗险赔付预测研究——引入健康行为偏好的新视角[J].华中师范大学学报（人文社会科学版）,2023,62(4):81-93. 被引量：1
9丁辉关,王雅丽.大数据分析在保险行业中的应用研究[J].金融纵横,2023(7):62-66.
10陈铭豪.数字经济时代下保险中介行业发展对策研究[J].特区经济,2024(4):111-115.

1王刚,李宁宁,杨善林.基于IDSSL的文本情感分析研究[J].管理工程学报,2018,32(3):126-133. 被引量：7
2邓羽翀.公路工程施工中财务风险管理的问题分析[J].广东经济,2017,0(3X):147-147.
3符美玲,陈登菊,肖明朝.关于构建我国基本医疗保险参保人诚信体系的思考[J].检验医学与临床,2019,16(6):857-860. 被引量：3
4余广成.非线性波动微分方程的变量分离及精确解分析[J].科技通报,2018,0(7):30-33. 被引量：1
5王爱萍,马奔,胡海峰.公司欺诈问题研究进展[J].经济学动态,2019(2):115-132. 被引量：8
6易展.浅谈企业资金管理存在的问题及解决对策[J].中国集体经济,2019(16):58-59. 被引量：12
7李琳,杨日东,王哲,张学良,周毅.基于机器学习方法的原发性肝癌患者预后预测研究[J].中国数字医学,2019,14(3):34-37. 被引量：12
8张楚凡,庄子威.网络拍卖欺诈法律问题与立法完善[J].人民法治,2018(11X):44-45.
9卢军,张国辉,李国强.一种基于数据分解的AES优化算法设计[J].单片机与嵌入式系统应用,2019,19(4):15-18. 被引量：3
10李建桥.国际贸易中电子合同欺诈问题研究[J].法制与经济,2019,28(1):84-86. 被引量：1

保险研究

2019年第4期

浏览历史

内容加载中请稍等...

Bagging集成方法在保险欺诈识别中的应用研究被引量：12

参考文献7

二级参考文献70

共引文献58

同被引文献105

引证文献12

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

Bagging集成方法在保险欺诈识别中的应用研究 被引量：12

参考文献7

二级参考文献70

共引文献58

同被引文献105

引证文献12

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

Bagging集成方法在保险欺诈识别中的应用研究被引量：12