摘要
保险公司通常需要根据不同投保人的历史信息确定投保人的风险以及制定相应的投保金额,是一种常见的集成学习方法,本文使用了一种基于boosting的梯度提升树模型用来构建保险行业的风险预估模型。我们将数据进行了预处理,初步分析了数据的特征、使数据可视化,并采用协方差矩阵,将脱敏的数据集中包含的变量相关性进行衡量;进一步采取,保证每次划分的训练集或验证集正负例比例相同。进而得到了一个AUC为模型性能评判依据的风险预估模型。
出处
《中国新通信》
2019年第13期240-242,共3页
China New Telecommunications