一般贝叶斯网络分类器及其学习算法被引量：9

Algorithm for exact recovery of Bayesian network for classification

下载PDF

导出

摘要贝叶斯网络(BN)应用于分类应用时对目标变量预测有直接贡献的局部模型称做一般贝叶斯网络分类器(GBNC)。推导GBNC的传统途径是先学习完整的BN,而现有推导BN结构的算法限制了应用规模。为了避免学习全局BN,提出仅执行局部搜索的结构学习算法IPC-GBNC,它以目标变量节点为中心执行广度优先搜索,且将搜索深度控制在不超过两层。理论上可证明算法IPC-GBNC是正确的,而基于仿真和真实数据的实验进一步验证了其学习效果和效率的优势:a)可输出和执行全局搜索的PC算法相同甚至更高质量的结构;b)较全局搜索消耗少得多的计算量;c)同时实现了降维(类似决策树学习算法)。相比于绝大多数经典分类器,GBNC的分类性能相当,但兼具直观、紧凑表达和强大推理的能力(且支持不完整观测值)。 General Bayesian network classifier（ GBNC） was the effective local section of the Bayesian network（ BN） facing classification problem. Conventionally,it had to learn the global BN first,and existing structure learning algorithm imposed restriction on possible problem scale. The paper developed an algorithm called IPC-GBNC for the exact recovery of GBNC with only local search. It conducted a breadth-first search with depth no more than 2 given the class node as the center. It proved its soundness,and experiments on synthetic and UCI real-world datasets demonstrate the merits of IPC-GBNC over classical PC algorithm which conducted global search： a） it produces same as or even higher quality of structure than PC,b） it saves considerable computation over PC,and c） effective dimension reduction is realized. As compared with state-of-the-art classifiers,GBNC not only performs as well on prediction,but inherits merits from being graphical model,like compact representation and powerful inference ability.

作者 Sein Minn 傅顺开吕天依蔡奕侨

机构地区华侨大学计算机科学与技术学院

出处《计算机应用研究》 CSCD 北大核心 2016年第5期1327-1334,共8页 Application Research of Computers

基金国家自然科学基金资助项目(61305058 61300139 61102163) 厦门科技计划基金资助项目(3505Z20133027) 华侨大学科研基金资助项目(11Y0274 12HJY18) 中央高校基本科研基金资助项目(11J0263)

关键词贝叶斯网络马尔可夫毯贝叶斯分类器结构学习特征选择局部搜索 Bayesian network Markov blanket Bayes classifier structure learning feature selection local search

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献25

1Koller D, Friedman N. Probabilistic graphical models:principles and techniques[ M ]. Cambridge : MIT Press ,2009.
2Koller D, Sahami M. Toward optimal feature selection [ C ]//Proc of the 13th International Conference on Machine Learning. [ S. 1. ] :Mar- gala Kanfmann, 1996.
3Fu S, Minn S, Desmarais M C. A survey on advances in Markov blan- ket induction algorithms[ C ]//Proc of ICNC-FSKD. 2014.
4Tsamardinos I,Aliferis C F, Statnikov A R. Algorithms for large scale Markov blanket discovery[ C ]//Proc of the 16th International Flairs Conference. 20133:376-380.
5Pena J M, Nilsson R, BjiSrkegren J ,et al. Towards scalable and data ef- ficient learning of Marker boundaries [ J ]. International doumal of Approximate Reasoning,2007,45(2) :211-232.
6Fu S, Desmarais M C. Local learning algorithm for Markov blanket dis- covery[ C ]//Pine of Australian Conference on Artificial Intelligence. 2007.
7Duda R O, Hart P E. Pattern classification and scene analysis [ M ]. [ S. 1. ] :Wiley, 1973:512.
8Friedman N, Geiger D, Goldszmidt M. Bayesian network classifiers [J]. Machine Learning,1997,29(2) :131-163.
9Zhang H, Jiang Liangxiao, Su Jiang. Hidden naive Bayes[ C ]//Proc of the 20th National Conference on Artificial Intelligence. [ S. 1. ] : AAAI Press, 2005 : 919 - 924.
10Chickering D M, Geiger D, Heckennan D. Learning Bayesian network is NP-hard[ R]. [ S. 1. ] : Microsoft, 1994:22.

二级参考文献42

1Han J, Kamber M. Data Mining: Concepts and Techniques. 2nd Edition. San Francisco, CA: Morgan Kaufmann, 2005.
2Friedman N, Geiger D, Goldszmidt M. Bayesian network classifiers. Machine Learning, 1997, 29(2/3): 131-163.
3Greiner R, Zhou W. Structural extension to logistic regres- sion= Discriminative parameter learning of belief net classifi- ers//Proceedings of the 18th Annual National Conference on Artificial Intelligence ( AAAI 2002). Edmonton, Canada, 2002:167-173.
4Greiner R, Su X, Shen B et al. Structural extension to logis- tic regression: Discriminative parameter learning of belief net classifiers. Machine Learning, 2005, 59(3): 297-322.
5Chickering D M, Heckerman D, Meek C. Large sample learning of Bayesian networks is NP-hard. The Journal of Machine Learning Research, 2004, 5 : 1287-1330.
6Tillman R E. Structure learning with independent non-identi cally distributed data//Proceedings of the 26th Annual Inter national Conference on Machine Learning. New York, 2009: 1041-1048.
7Zheng Z, Webb G I. Lazy learning of Bayesian rules. Machine Learning, 2000, 41(1): 53-84.
8Keogh E J, Pazzani M J. Learning the structure of augmen- ted Bayesian classifiers. International Journal on Artificial In telligence Tools, 2002, 11(4): 587-601.
9Webb G I, Boughton J R, Wang Z. Not so naive Bayes: Ag- gregating one-dependence estimators. Machine Learning, 2005, 58(1): 5-24.
10Naele A, Dejori M, Stetter M. Bayesian substructure learn- ing- Approximate learning of very large network strue tures//Proceedings of the 18th European Conference on Ma- chine Learning (ECML, 2007). Warsaw, Poland, 2007: 238-249.

共引文献28

1汪文隽,王亦天,操玮,任思儒.基于多模态投资者情绪数据的USD/CNY汇率波动率预测研究[J].计算机应用研究,2020,37(S02):152-155. 被引量：2
2高妍方,王继伟.贝叶斯网络生成学习和判别学习对比研究[J].山东建筑大学学报,2013,28(4):328-334.
3于江德,赵红丹,郑勃举,余正涛.基于中文人名用字特征的性别判定方法[J].山东大学学报（工学版）,2014,44(1):13-18. 被引量：2
4孟光胜,赵志宇.基于两层主动学习策略的SVM分类方法[J].河南师范大学学报（自然科学版）,2014,42(2):158-162. 被引量：1
5谢科.融合协同训练和两层主动学习策略的SVM分类方法[J].湖南师范大学自然科学学报,2014,37(1):93-97. 被引量：1
6李艳颖,杨有龙,汪春峰.基于粗糙集属性约简与进化算法的贝叶斯网络分类器[J].郑州大学学报（理学版）,2014,46(2):43-49. 被引量：2
7赵森栋,刘挺.因果关系及其在社会媒体上的应用研究综述[J].软件学报,2014,25(12):2733-2752. 被引量：15
8王双成,高瑞,冷翠平.连续属性一阶贝叶斯衍生分类器学习与集成[J].模式识别与人工智能,2015,28(6):499-506.
9刘江涛.无线传感器网络的三层结构生存分析[J].计算机与数字工程,2015,43(9):1644-1646. 被引量：1
10单凯,高仲合,李凤银.云计算环境下的P2P流量识别[J].计算机工程与应用,2015,51(19):88-92. 被引量：1

同被引文献54

1李刚,许鹏程,韩龙美.基于小波分析的电力系统故障时空检测与诊断[J].系统仿真学报,2015,27(12):3018-3024. 被引量：10
2李道国,苗夺谦,俞冰.决策树剪枝算法的研究与改进[J].计算机工程,2005,31(8):19-21. 被引量：30
3陈伏兵,陈秀宏,高秀梅,杨静宇.二维主成分分析方法的推广及其在人脸识别中的应用[J].计算机应用,2005,25(8):1767-1770. 被引量：20
4李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
5淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：82
6郭创新,朱传柏,曹一家,吴欣.电力系统故障诊断的研究现状与发展趋势[J].电力系统自动化,2006,30(8):98-103. 被引量：134
7徐建民,唐万生,陈振亚.贝叶斯网络在信息检索中的应用[J].河北大学学报（自然科学版）,2007,27(1):93-98. 被引量：4
8王惠文,孟洁.多元线性回归的预测建模方法[J].北京航空航天大学学报,2007,33(4):500-504. 被引量：241
9陈韡,王雷,蒋子云.基于K-prototypes的混合属性数据聚类算法[J].计算机应用,2010,30(8):2003-2005. 被引量：16
10王明涛.多指标综合评价中权数确定的离差、均方差决策方法[J].中国软科学,1999(8):100-101. 被引量：263

引证文献9

1邹波,段立,骆凯波,叶君,郑静雯.基于贝叶斯网络优化算法的采集终端故障预测系统设计与应用[J].电工技术,2017(5):1-4. 被引量：2
2王轩,刘福伦,张林,王宏杰,闵帆.邻域覆盖分类的两种加权策略[J].计算机应用,2018,38(A01):1-5. 被引量：1
3安宁,滕越,杨矫云,李廉.基于因果效应的贝叶斯网络结构学习方法[J].计算机应用研究,2018,35(12):3609-3613. 被引量：9
4王轩,张林,高磊,蒋昊坤.基于代表的留一法集成学习分类[J].计算机应用,2018,38(10):2772-2777. 被引量：1
5邓思宇,刘福伦,黄雨婷,汪敏.基于PageRank的主动学习算法[J].智能系统学报,2019,14(3):551-559. 被引量：1
6蒋鹏飞,魏松杰.基于深度森林与CWGAN-GP的移动应用网络行为分类与评估[J].计算机科学,2020,47(1):287-292. 被引量：7
7汪抑非,李创,柴秋子,黄志龙,金肖玲,付立.大型机泵健康监测与诊断系统设计与应用[J].工业仪表与自动化装置,2020,0(2):33-36. 被引量：3
8刘佳宇,周凌云,吴秋峰,孟翔燕,邓华玲.一种适用于混合属性数据的K近邻方法[J].数学的实践与认识,2020,50(16):132-143. 被引量：2
9汪敏,武禹伯,闵帆.基于多种聚类算法和多元线性回归的多分类主动学习算法[J].计算机应用,2020,40(12):3437-3444. 被引量：6

二级引证文献32

1张维,高明明,伯运鹤,翟海涛.基于PMI-IMSET的锅炉辅机故障预警[J].华北电力大学学报（自然科学版）,2019,46(6):73-80. 被引量：1
2吴永明,赵旭东,陈琳升,史海鹏,王亚昆.基于贝叶斯理论的复杂装备综合性能评价方法研究[J].组合机床与自动化加工技术,2020(3):164-168.
3寇兴怡,帅斌,黄文成.基于贝叶斯网络的高速动车组运营故障分析[J].中国安全生产科学技术,2020,16(4):63-69. 被引量：13
4陆冰芳,张希翔.基于机器学习的电网信息系统安全风险预测模型构建[J].电子设计工程,2020,28(13):128-132. 被引量：3
5时召伟,魏松杰.基于贝叶斯网络的Android应用风险评估的研究[J].合肥工业大学学报（自然科学版）,2020,43(6):753-757. 被引量：4
6张敏,周治平.结合度量融合和地标表示的自编码谱聚类算法[J].智能系统学报,2020,15(4):687-696. 被引量：1
7李佳佳,丁伟,王伯伟,聂秀山,崔超然.基于随机森林的民俗体育对身体指标影响评估方法[J].南京大学学报（自然科学版）,2021,57(1):59-67. 被引量：5
8徐苗,王慧玲,梁义,綦小龙.基于K2算法的因果结构学习研究综述[J].伊犁师范学院学报（自然科学版）,2021,15(1):51-57. 被引量：2
9张晓岚.基于DSP的矿井采煤机状态监测及故障诊断系统设计[J].煤炭与化工,2021,44(5):69-72. 被引量：2
10柳永春,李娟.基于主动学习的图像分类协同训练模型研究[J].赤峰学院学报（自然科学版）,2021,37(11):3-6. 被引量：3

1李显杰,张佑生,李剑飞.基于量子遗传算法的贝叶斯网络结构学习[J].计算机应用研究,2008,25(4):996-998. 被引量：2
2张仲金,高明伦,沙金,李丽,董岚.基于自身可信度的低复杂度LDPC码位翻转解码算法[J].微电子学与计算机,2008,25(7):92-94. 被引量：2
3吕国云,赵荣椿,蒋冬梅,SAHLI H.基于上下文三音素DBN模型的连续语音识别[J].计算机工程与应用,2007,43(35):35-38.
4朱明敏,刘三阳,杨有龙.基于混合方式的贝叶斯网络等价类学习算法[J].电子学报,2013,41(1):98-104. 被引量：9
5李辉燕,肖新华.软件工程在小型项目开发中的应用[J].黄石理工学院学报,2005,21(4):68-70.
6王越,程昌正.协同过滤算法在电影推荐中的应用[J].四川兵工学报,2014,35(5):86-88. 被引量：7
7钟清流.一种用于DM的改进型BN模型生成算法[J].计算机工程与应用,2001,37(9):100-102. 被引量：1
8雷震洲：保护环境应充分用好ICT这把“双刃剑”[J].网络电信,2009,11(4):36-36.
9韩敏,席剑辉,范明明.神经网络应用于多元变量时间序列的建模研究[J].仪器仪表学报,2006,27(3):275-279. 被引量：6
10赵曦.投影寻踪和神经网络算法的石油价格预测[J].计算机仿真,2012,29(5):371-374. 被引量：2

计算机应用研究

2016年第5期

浏览历史

内容加载中请稍等...

一般贝叶斯网络分类器及其学习算法被引量：9

参考文献25

二级参考文献42

共引文献28

同被引文献54

引证文献9

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

一般贝叶斯网络分类器及其学习算法 被引量：9

参考文献25

二级参考文献42

共引文献28

同被引文献54

引证文献9

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

一般贝叶斯网络分类器及其学习算法被引量：9