非完备数据的宽带客户流失预测被引量：2

下载PDF

导出

摘要在实际数据中,由于人为、设备等原因,不可避免的会出现数据缺失问题。针对缺失值的处理方法一是删除,二是填充。若数据缺失较少,删除存在缺失值的样本不失为一个快速简单的方法,但若缺失值较多,大量删除样本就会损失掉重要信息,不利于模型的建立,预测效果也会不理想。本文从非完备数据出发,采用SimpleImputer、KNNImputer、IterativeImputer三种方法来填充缺失的数据,建立宽带客户流失随机森林分类模型,经过对比分析得出IterativeImputer方法补充缺失值分类效果更好的结论。

作者张芸宋双

机构地区中国移动云南公司网络部质量管理室云南省高校数据化运营管理工程研究中心云南财经大学统计与数学学院

出处《中国新通信》 2021年第14期125-126,共2页 China New Telecommunications

关键词缺失值填充随机森林

分类号 F626 [经济管理—产业经济] F274 [经济管理—企业管理] TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

同被引文献11

1鄢梦迪,秦琳琳,吴刚.基于主成分分析和K近邻的文件类型识别算法[J].计算机应用,2016,36(11):3161-3164. 被引量：3
2陈娟,王献雨,罗玲玲,崔晶晶.缺失值填补效果:机器学习与统计学习的比较[J].统计与决策,2020(17):28-32. 被引量：18
3赵云丽.利用Python实现计量检定中异常值快速剔除[J].工业计量,2020,30(6):47-48. 被引量：3
4郝雅娴.K-Means聚类中心最近邻推荐算法[J].山西师范大学学报（自然科学版）,2021,35(1):72-78. 被引量：7
5李兵,陈俊才.基于TMRF算法的电信客户流失预测方案研究[J].数字技术与应用,2021,39(4):116-121. 被引量：3
6张春霞,王贺,张雅琴,耿乐乐,郭天霞,孙海静.脉冲电沉积Ni-TiC复合镀层的工艺研究[J].辽宁化工,2021,50(9):1283-1286. 被引量：2
7邹彤彤,杨涛,周勇,王仲平,余来斌,王东凯,肖荣,出晓娟.基于KNN算法的隧道地表变形监测数据异常检测分析[J].科学技术创新,2021(28):95-97. 被引量：5
8杨成义,林瑞琼.数据挖掘在电信客户流失预警模型中的应用[J].现代信息科技,2021,5(17):32-34. 被引量：1
9孟令雯,张锐锋,李鑫卓,席禹.基于机器学习的变电站设备异常状态数据清洗[J].电力系统及其自动化学报,2021,33(12):79-86. 被引量：20
10乔健,诸佳慧,严康桓.基于随机森林CART特征选择改进算法的电信客户流失预测模型[J].电信工程技术与标准化,2022,35(3):78-82. 被引量：9

引证文献2

1张婷暄,邓久宁,汪洁,孙怀宇.基于主成分分析与K近邻分类算法的化工干燥分类模型[J].辽宁化工,2022,51(5):696-699.
2于明鑫,郑雅匀.基于神经网络算法的电信客户流失预测[J].现代信息科技,2023,7(2):30-33. 被引量：1

二级引证文献1

1邱伟斌,连壮.基于神经网络算法的电信客户选择预测模型研究[J].厦门城市职业学院学报,2024,26(2):84-89.

1王繁,王果,周子轩,乔智,牛晨.LSTM对配电台区短期负荷预测的适用性研究[J].电力系统及其自动化学报,2021,33(8):41-48. 被引量：10

中国新通信

2021年第14期

浏览历史

内容加载中请稍等...

非完备数据的宽带客户流失预测被引量：2

同被引文献11

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

非完备数据的宽带客户流失预测 被引量：2

同被引文献11

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

非完备数据的宽带客户流失预测被引量：2