-
题名聚类随机采样和代价敏感的电信客户流失预测集成模型
被引量:1
- 1
-
-
作者
李毅
马文斌
李国祥
-
机构
澳门科技大学商学院决策科学系
广西财经学院大数据与人工智能学院
广西财经学院教务处
广西财税大数据分析工程研究中心
广西财经学院网络与信息技术中心
-
出处
《企业科技与发展》
2023年第11期97-105,共9页
-
基金
国家自然科学基金资助项目(71862003)
应用经济学广西一流学科建设项目基金资助(2022GSXKA01)
广西财税大数据分析工程研究中心建设资助。
-
文摘
文章为解决客户流失预测中因数据类别高度不平衡导致模型性能降低的问题,基于Bagging集成思想,提出一种融合聚类随机采样、代价敏感的预测模型(RWBC-Ensemble)。首先,利用聚类随机采样方法降低数据的不平衡度;其次,将流失客户样本划分为安全样本和危险样本,并为不同类别的样本赋予不同的权重;最后,以代价敏感的梯度提升决策树为基学习器,对采样数据进行预测。此外,研究在RWBC-Ensemble融入特征选择、数据清洗2个模块,进一步提高数据质量。根据4个高度不平衡客户数据上的实验结果,RWBC-Ensemble的AUC、Recall平均提升了3.76%、19.92%,但由于搜集数据的困难性,未能在更多不平衡客户流失的数据上验证该模型的有效性。研究结果表明,该模型拥有更好的客户流失预测性能,对提高客户留存率具有重要作用,为企业制定和实施客户留存策略提供重要参考依据。
-
关键词
客户流失预测
不平衡数据
随机采样
代价敏感学习
集成学习
-
分类号
F626
[经济管理—产业经济]
F274
[经济管理—企业管理]
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名密集特征哈希的遥感场景分类
- 2
-
-
作者
李国祥
夏国恩
白丽明
马文斌
-
机构
广西财经学院教务处
广西财税大数据分析工程研究中心
广西财经学院工商管理学院
-
出处
《自然资源遥感》
CSCD
北大核心
2023年第1期66-73,共8页
-
基金
国家自然科学基金资助项目“网络客户特征分析与流失预测研究”(编号:71862003)
“大容量图像可逆信息隐藏理论与方法研究”(编号:62162006)
广西高校中青年教师基础能力提升资助项目“基于特征混合编码的遥感场景分类研究”(编号:2021KY0650)共同资助。
-
文摘
针对遥感场景的精准分类,提出了密集网络特征哈希的场景分类算法。基于密集网络输出的高层语义特征,经全连接层过渡降维后,激活函数生成归一化的特征向量作为分类层的判断输入,形成端到端的分类网络。训练后的网络作为特征提取器,将测试数据激活层特征映射生成二值哈希码,最后采用支持向量机分类。所提出的算法分别在UC Merced,WHU和NWPU-RESISC45公开数据集进行了验证,分别与传统局部特征描述子、迁移学习、深度特征编码3个层次的多种算法进行了对比,实验结果表明,相比于传统中低层语义特征,分类准确度得到大幅度提高;相比于深度学习网络的迁移,密集特征映射表达精细,聚集影像核心类别判断要素,更符合遥感影像的特征分布;相比于深度特征编码算法,特征结构简单,分类精度高,迁移和拓展性强,可以满足不同遥感场景分类要求。
-
关键词
迁移学习
特征编码
密集网络
哈希码
-
Keywords
transfer learning
feature coding
DenseNet
hash code
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-