基于K-均值聚类的朴素贝叶斯网络分类模型被引量：3

A Nave Bayesian Network Classification Model Based on K-means Clustering

下载PDF

导出

摘要针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类属性变量相对于类属性变量相对独立的前提条件,算法首先用主元分析法在对数据集的信息量尽量保存的同时进行了降维操作,使得算法可以着重于进行分类问题;算法还提出了一个"相对融合点"的概念,有效地提高了算法的性能;最后对算法的性能进行了分析,并将改进的算法应用到实际的数据集进行实验,用算法产生的分类结果对数据集中产生的一些缺失数据进行修补。 According to the low efficiency and low accuracy of the naive Bayesian network classification model in dealing with large number of high-dimensional data, by combining Principal Component Analysis and K-means clustering algorithm, this paper gives an improved Navve Bayesian network classification model. The model abandoned the premise for the relative independence between non-class attribute variables and class attribute variables. Firstly, we use principal component analysis to reduce the dimensionality of the data set, so the algorithm can focus on the classification problem. The algorithm has also proposed a concept called ＂relative fusion point＂ to effectively improve the performance of the algorithm. Finally, the performance of the algorithm is analyzed, and the improved algorithm is applied to the actual data set for experiment to repair the missing data of the data set, the results show that the algorithm is effective.

作者刘亚辉王越谭暑秋

机构地区重庆理工大学计算机科学与工程学院

出处《重庆工商大学学报（自然科学版）》 2012年第8期36-41,共6页 Journal of Chongqing Technology and Business University:Natural Science Edition

基金重庆市科技攻关资金资助项目(CSTC 2009AC2068)

关键词贝叶斯网络分类朴素贝叶斯网络 K-均值聚类数据挖掘 Bayesian network classification Naive Bayesian network K-means clustering data mining

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1PELIKAN M, GOLDBERG D, SASTRY K. Bayesian optimization algorithm, decision graphs,and Ocam' s razor[ R]. Proceedings of the Genetic and Evolutionary Computation Conference (GECCO-2001) ,PP. 519-526. Also IlliGAL Report No. 2000020 (2001).
2FRIEDMAN N,GEIGER D,GOLDSZMIDT M. Bayesian Network Classifiers[ J]. Machine Learning, 1997,29:103-163.
3PELIKAN M, SASTRY K, GOLDBERG D. Scalability of the Bayesian optimization algorithm [ J ]. International Journal of Approximate Reasoning,2002,3i (3) :221-258.
4KAI M, ZHENG Z. A Study of AdaBoost with Nm've Bayesian Classifier: Weakness and Improvement [ J ]. Computational Intelligence ,2003 (19) : 186-200.
5DING Z,PENG Y,PAN R. BayesOWL: Uncertainty Modeling in Semantic Web Ontologies [ J ]. In Soft Computing in Ontologies and Semantic Web, Springer-Verlag, December 2005.
6HAN J, KAMBER M. Data Mining : Concepts and Techniques[ M ]. Academic Press ,2001.
7王洪春,彭宏.一种基于主成分分析的异常点挖掘方法[J].计算机科学,2007,34(10):192-194. 被引量：14

二级参考文献9

1陈华,李继波.异常(Outlier)检测算法综述[J].大众科技,2005(9):96-97. 被引量：3
2钱昌明,李国庆,黄皓.分类异常点检测算法及在IDS模型中的应用[J].计算机应用研究,2006,23(4):94-96. 被引量：2
3王宏鼎,童云海,谭少华,唐世渭,杨冬青.异常点挖掘研究进展[J].智能系统学报,2006,1(1):67-73. 被引量：22
4王惠文.偏最小二乘回归分析及其应用[M].北京:国防工业出版社,1999.130-184.
5Han Jiawei, Kamber M. Data mining: concepts and techniques. New York: Morgan Kaufmann Publishers, 2001
6Ester M,Kriegel H, Sander J,Xu X. A density-based algorithm for discovering clusters in large spatial database with noise. In: Proceedings of the 2nd conference on Knowledge Discovering in Databases and Data Mining,Portland, USA, 1996. 226-231
7Knorr E, Ng R. Algorithms for mining distance-based outliers in large datasets. In:Proceedings of Very Large Data Bases(VLDB' 98), New York, USA, 1998. 392- 403
8李之棠,刘颉.入侵检测中的模糊数据挖掘技术[J].计算机工程与科学,2002,24(2):18-21. 被引量：3
9李炎,李皓,钱肖鲁,朱扬勇.异常检测算法分析[J].计算机工程,2002,28(6):5-6. 被引量：20

共引文献13

1夏天.基于主成分分析的远程教学平台评价模块[J].计算机工程与应用,2008,44(30):210-212. 被引量：1
2卢鸣.基于异常点处理和自劈分合并学习的聚类方法[J].福建电脑,2008,24(12):83-84.
3张春生,李艳,王海珍,张世铮.基于纵横距离的单纯异常点检测算法及应用[J].内蒙古民族大学学报（自然科学版）,2009,24(4):371-373. 被引量：1
4彭玲,徐汀荣.一种基于属性相似度的孤立点挖掘方法[J].计算机应用与软件,2010,27(12):236-237. 被引量：1
5冯大春,鲁红.数据驱动技术在石化工业运行中的应用[J].石油化工自动化,2010,46(6):28-35. 被引量：1
6全雪峰.基于GEAHP模糊综合评判的教学质量评价系统[J].微型机与应用,2011,30(11):73-75. 被引量：3
7李振杰,卞朝晖,陈学民,马松,郭航源,林江.变压器油色谱在线监测数据有效性评估[J].高压电器,2018,54(6):158-163. 被引量：17
8张蓓,王顺芳.基于MCD稳健估计的PCA人脸识别算法[J].计算机工程与设计,2015,36(3):778-782. 被引量：11
9徐久成,黄方舟,穆辉宇,王云,徐战威.基于PCA和信息增益的肿瘤特征基因选择方法[J].河南师范大学学报（自然科学版）,2018,46(2):104-110. 被引量：10
10黄振宇,魏伟,于文泽,张凤强.基于模糊C均值的吸能结构设计[J].沈阳师范大学学报（自然科学版）,2021,39(3):272-275.

同被引文献39

1赵静芬,李坚,李日南,务文涛,宋凌勇,张旭升.Box-Behnken响应面法优化CTD气流烘丝工艺[J].湖北农业科学,2021,60(S01):311-316. 被引量：2
2熊刚,孟姣,曹自刚,王勇,郭莉,方滨兴.网络流量分类研究进展与展望[J].集成技术,2012,1(1):32-42. 被引量：24
3杨道理,李保昌.蛋白质纯化的方法选择[J].实用医药杂志,2004,21(12):1121-1123. 被引量：11
4张其文,李明.一种缺失数据的填补方法[J].兰州理工大学学报,2006,32(2):102-104. 被引量：7
5邓维斌,王国胤,王燕.基于Rough Set的加权朴素贝叶斯分类算法[J].计算机科学,2007,34(2):204-206. 被引量：43
6张晓龙,江川,骆名剑.ROC分析技术在机器学习中的应用[J].计算机工程与应用,2007,43(4):243-248. 被引量：15
7张靖,姚珍,唐雪飞.基于决策树的不完整数据的处理[J].电子科技大学学报,2007,36(1):116-118. 被引量：6
8张宏亭,李学仁,孔韬.BP神经网络在缺失数据估计中的应用[J].计算机工程与设计,2007,28(14):3457-3459. 被引量：13
9Zhang H.The optimality of Naive Bayes[C]//Proceedings of FLAIRS-2004 Conference,2004.
10Ramoni M,Sebastiani P.Robust Bayes classi fi ers[J].Artif Intell,2001,125(1/2):209-226.

引证文献3

1李忠波,杨建华,刘文琦.基于数据填补和连续属性的朴素贝叶斯算法[J].计算机工程与应用,2016,52(1):133-140. 被引量：4
2谷跃,唐学文.一种多分类器联合的网络流量分类方法[J].重庆工商大学学报（自然科学版）,2016,33(4):74-78. 被引量：1
3詹伟剑,刘永明,谢鹏,刘志博,赵转哲.CTD气流式烘丝机设备故障预测[J].淮阴工学院学报,2023,32(1):12-17. 被引量：1

二级引证文献6

1梁秉毅,蔡延光,蔡颢,戚远航,黄何列,Ole Hejlesen.基于优化决策树和EM的缺失数据填充算法[J].自动化与信息工程,2017,38(5):37-43. 被引量：2
2李彦,刘军.面向大数据的多维数据缺失特征填补仿真研究[J].计算机仿真,2018,35(10):432-435. 被引量：11
3刘迪,李迎春.基于深度信念网络的遥感图像质量评价[J].兵器装备工程学报,2019,40(2):225-230. 被引量：1
4任世超,黄子良.基于二维信息增益加权的朴素贝叶斯分类算法[J].计算机系统应用,2019,28(6):135-140. 被引量：4
5李舒,张伟业,汪坤,段照斌.基于聚类分析的航班油耗组合估计[J].计算机与现代化,2022(8):65-69.
6汪冬冬,侯加文,焦帅帅,江豪,张保威.基于FA-BP神经网络模型的烘丝机设备故障诊断[J].中国仪器仪表,2024(1):40-44. 被引量：2

1石洪波,黄厚宽.贝叶斯网络分类器稳定性研究[J].模式识别与人工智能,2004,17(3):275-280. 被引量：2
2宿娇娜,李巍,唐发根,李云春.基于NB分类方法的网络异常检测模型[J].计算机应用研究,2008,25(2):569-571. 被引量：1
3李柏生,林亚平,鄢喜爱.基于朴素贝叶斯网络的入侵检测分析[J].网络安全技术与应用,2007(9):23-25. 被引量：3
4罗凌,杨有,马燕.基于TAN贝叶斯网络的学习风格检测研究[J].计算机工程与应用,2015,51(6):48-54. 被引量：8
5吕虹.基于EM-BN算法的网络调查问卷分析研究[J].贵州师范学院学报,2013,29(9):22-25. 被引量：1
6林璐.基于马尔科夫毯网络的客户流失分析[J].计算机光盘软件与应用,2014,17(23):97-98.
7李兰春,王双成,王辉.课堂教学评估的多层次贝叶斯网络分类器方法[J].东北师大学报（自然科学版）,2012,44(1):50-54.
8戴芹,陈雪,马建文,李启青,冯春.遥感数据的BN与ML分类对比研究[J].计算机工程,2005,31(15):35-36.
9李旭升,郭春香,郭耀煌.扩展的树增强朴素贝叶斯网络信用评估模型[J].系统工程理论与实践,2008,28(6):129-136. 被引量：12
10李雪莲.基于EM-PCA的贝叶斯网络分类测试算法[J].电子质量,2015(10):1-4.

重庆工商大学学报（自然科学版）

2012年第8期

浏览历史

内容加载中请稍等...

基于K-均值聚类的朴素贝叶斯网络分类模型被引量：3

参考文献7

二级参考文献9

共引文献13

同被引文献39

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于K-均值聚类的朴素贝叶斯网络分类模型 被引量：3

参考文献7

二级参考文献9

共引文献13

同被引文献39

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于K-均值聚类的朴素贝叶斯网络分类模型被引量：3