基于缺失数据BN参数学习的电信流失客户预测算法被引量：1

A prediction algorithm of telecom customer churn based on Bayesian network parameters learning under incomplete data

下载PDF

导出

摘要针对电信客户流失预测问题,在数据缺失情况下,基于贝叶斯网络(Bayesian network,BN),用最近邻算法填补缺失数据,并将两类定性约束融入贝叶斯网络参数学习过程,用以提高流失客户预测精度。仿真及实际数据分析结果表明,所提算法较经典的期望最大化(expectation maximization,EM)算法有明显优势,在牺牲代价较小的忠诚客户预测精度的情况下,得到了更高的流失客户预测精度。 Aiming at prediction of telecom customer churn,a novel method was proposed to increase the prediction accuracy with the missing data based on the Bayesian network.This method used k-nearest neighbor algorithm to fill the missing data and adds two types of monotonic influence constraints into the process of learning Bayesian network parameter.Simulations and actual data analysis demonstrate that the proposed algorithm obtains higher prediction accuracy of churn customers with the loss of less cost prediction accuracy of loyal customers,outperforms the classic expectation maximization algorithm.

作者赵宇翔卢光跃王航龙李四维

机构地区西安邮电大学陕西省信息通信网络及安全重点实验室

出处《电信科学》 2018年第1期52-60,共9页 Telecommunications Science

基金陕西省工业科技攻关项目(No.2015GY-013) 陕西省工业科技攻关项目(No.2016GY-113)~~

关键词贝叶斯网络参数学习数据缺失最近邻算法定性约束 Bayesian network, parameter leaming, data missing, nearest neighbor algorithm, qualitative constraint

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1刘星毅.基于马氏距离和灰色分析的缺失值填充算法[J].计算机应用,2009,29(9):2502-2504. 被引量：6
2杨宇,高晓光,郭志高.小数据集条件下基于数据再利用的BN参数学习[J].自动化学报,2015,41(12):2058-2071. 被引量：7
3胡小建,杨善林,马溪骏.基于联结树的贝叶斯网的推理结构及构造算法[J].系统仿真学报,2004,16(11):2559-2563. 被引量：10

二级参考文献43

1杨涛,骆嘉伟,王艳,吴君浩.基于马氏距离的缺失值填充算法[J].计算机应用,2005,25(12):2868-2871. 被引量：24
2邓聚龙.灰色系统理论[M].武汉:华中工学院出版社,1984:1-30.
3COVER T M, HART P E. Nearest neighbor pattern classification [ J]. IEEE Transactions on Information Theory, 1967, 13( 1): 21 -27.
4HAN J, KAMBER M. Data mining concepts and techniques [ M]. 2nd ed. San Francisco: Morgan Kaufmann Publishers, 2006.
5SCHAFER J, GRAHAM J. Missing data: Our view of the state of the art [J]. Psychological Methods, 2002, 7(2): 147 -177.
6LAKSHMINARAYAN K, HARP S A, SAMAD T. Imputation of missing data in industrial databases [ J]. Applied Intelligence, 1999, 11(3): 259-275.
7LITTLE R, RUBIN D. Statistical analysis with missing data [ M]. 2nd ed. New York: John Wiley and Sons, 2002.
8HUANG C C, LEE H M. A grey-based nearest neighbor approach for missing attribute value prediction [ J]. Applied Intelligence 2004, 20(3): 239 -252.
9SPELLMAN P T, SHERLOCK G, ZHANG M Q, et al. Comprehensive identification of cell cycle-regulated genes of the yeast saccharomyces cerevisiae by micro array hybridization [ J]. Molecular Biology of the Cell, 1998, 9(12) : 3273 -3297.
10DERISI J L, IYER V R, BROWN P O. Exploring the metabolic and genetic control of gene xpression on a genomic scale [ J]. Science, 1997, 278(5338): 680-686.

共引文献20

1李利平,张春发,牛玉广,马进.基于概率模型的热力机组性能诊断与仿真[J].动力工程,2007,27(4):564-568.
2杨昌昊,竺长安,胡小建.基于贝叶斯网的复杂系统故障诊断方法[J].中国机械工程,2009,20(22):2726-2732. 被引量：8
3杨婷婷,曾德良,刘继伟,刘吉臻.大型火力发电机组节能优化研究与展望[J].华东电力,2010,38(6):898-902. 被引量：14
4马静.贝叶斯网络的战场作战意图评估方法[J].西安工业大学学报,2010,30(4):397-401. 被引量：8
5王立群.基于最小诊断集的贝叶斯网络诊断模型研究[J].微计算机信息,2010,26(28):114-115.
6包海青,安慧君,贺晓辉,于楠楠.基于马氏距离的TM数据森林分类方法研究[J].内蒙古农业大学学报（自然科学版）,2013,34(2):61-64. 被引量：3
7付明柏.基于异质矩阵完全的缺失数据恢复混合集成算法[J].云南师范大学学报（自然科学版）,2013,33(6):67-72. 被引量：2
8张赤,丰洪才,金凯,杨婷.基于聚类分析的缺失数据最近邻填补算法[J].计算机应用与软件,2014,31(5):282-284. 被引量：13
9刘淑芬,杨双双,王辉.基于故障树和Bayes网络组合的装备故障诊断[J].吉林大学学报（理学版）,2014,52(5):982-988. 被引量：4
10毕武,袁小龙,段新力,黄显义,彭仲秋,李永华,向诗强,张恒.用马氏距离方法提取化探综合异常[J].新疆有色金属,2015,38(2):66-68. 被引量：3

同被引文献3

1田玲,邱会中,郑莉华.基于神经网络的电信客户流失预测主题建模及实现[J].计算机应用,2007,27(9):2294-2297. 被引量：18
2侯阿临,李飞.贝叶斯MLP神经网络在IP承载网性能预测的研究[J].软件,2013,34(4):96-97. 被引量：1
3张小敏,伍小平,丰婷,胡景.基于最优加权组合的电信客户流失预测模型设计研究[J].赤峰学院学报（自然科学版）,2017,33(12):3-4. 被引量：5

引证文献1

1周荣鑫,赵娟娟,靳梦华.基于贝叶斯网络的电信客户流失预测分析[J].软件,2019,40(2):187-190. 被引量：3

二级引证文献3

1周斌.信息通信产业发展趋势及中国电信公司运营策略研究[J].电子元器件与信息技术,2020,4(7):47-48. 被引量：3
2余思东,黄欣.CART算法在航空公司客户流失的应用[J].轻工科技,2021(9):76-79.
3张三妞,张智斌.基于改进粒子群的随机森林优化算法客户流失预测研究[J].现代信息科技,2021,5(22):75-78. 被引量：1

1段晓林.影印版民国文献核心出版社测定及其出版研究[J].图书馆,2017(11):56-60. 被引量：8
2崔素芳.工行网银,我的理财助手[J].中国信用卡,2017,0(12):64-66.
3鲁春,杨会成,杨文斌,朱文博.结合光流法与最近邻算法的运动目标检测[J].四川理工学院学报（自然科学版）,2017,30(5):63-68. 被引量：2
4林润生,黄明明.局部均值伪最近邻算法在降水预报中的应用[J].沙漠与绿洲气象,2017,11(5):1-8. 被引量：2
5穆学雯.一种局部特征点提取方法及在监控系统中的应用研究[J].山西科技,2017,32(5):123-126. 被引量：1
6李会,吴小兰,李侠.电信客户流失预测模型的构建及客户流失因素分析[J].内蒙古农业大学学报（社会科学版）,2017,19(3):23-27. 被引量：3
7Mao-Kuan Zheng,Xin-Guo Ming,Xian-Yu Zhang,Guo-Ming Li.MapReduce Based Parallel Bayesian Network for Manufacturing Quality Control[J].Chinese Journal of Mechanical Engineering,2017,30(5):1216-1226. 被引量：4
8邓居敏,陈羽,关颖.基于结构方程模型的缺失数据填补方法比较[J].数理医药学杂志,2018,31(2):159-161. 被引量：2
9曾令梦,高强,侯远龙,孙战,蒋梦琴.基于自构建神经网络的舰载火箭炮内模控制[J].火炮发射与控制学报,2017,38(4):40-44. 被引量：1
10关海清.农户林下种养殖技术服务需求的影响因素[J].花卉,2017,0(18):145-146.

电信科学

2018年第1期

浏览历史

内容加载中请稍等...

基于缺失数据BN参数学习的电信流失客户预测算法被引量：1

参考文献3

二级参考文献43

共引文献20

同被引文献3

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于缺失数据BN参数学习的电信流失客户预测算法 被引量：1

参考文献3

二级参考文献43

共引文献20

同被引文献3

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于缺失数据BN参数学习的电信流失客户预测算法被引量：1