期刊文献+

基于属性相关的朴素贝叶斯分类算法 被引量:6

Naive Bayes Classification Algorithm Based on Attribute Correlation
下载PDF
导出
摘要 朴素贝叶斯分类器是一种简单、高效的分类算法,它以贝叶斯定理和最大后验假设为理论基础,然而朴素贝叶斯分类器属性之间相互独立的假设,影响了朴素贝叶斯分类器的性能.提出先使用基于相关的属性选择算法进行属性选择,然后在选择的属性集上,用朴素贝叶斯分类器对数据集进行分类.实验证明,与未使用属性选择的实验结果相比,使用基于相关的属性选择算法进行属性选择后,朴素贝叶斯分类器平均分类正确率提高,分类效率显著提升. Naive Bayes classifier is a simple and effective classification method. Its theory foundation is Bayesian and maximum posteriori assumptions. But independence assumption of properties affects the performance of the Naive Bayes classifier. This paper presents a way to improve the performance of the Naive Bayes classifier. It selects attribute set from all attributes of the data sets by correlation-base feature selecting algornthin and classifies the data sets by Naive Bayes classifier. Experimental results show that the average correct classification rate increases and the efficiency of classification significantly improves compared with the unused attribute selection.
作者 魏浩 丁要军
出处 《河南科学》 2014年第1期42-46,共5页 Henan Science
基金 陕西省科学技术研究计划项目(2013JM8037) 陕西省教育厅科学研究项目(12JK0933) 咸阳师范学院专项科研项目(13XSYK056)
关键词 朴素贝叶斯 属性相关 信息熵 信息增益 naive Bayes attribute correlation information entropy information gain
  • 相关文献

参考文献9

  • 1HanJ,MickelineK,PeiJ.数据挖掘:概念与技术[M].3rded.范明,孟小峰,译.北京:机械工业出版社,2012.
  • 2Jiang L X, Zhang H, Cai Z H, et al. Evolutional Naive Bayes [C]//Proc. First Int'I Symp. Intelligent Computation and Its Applications (ISICA' 05), Wuhan, China: China University of Geosciences Pres, 2005.
  • 3Liu H, Sun J, Liu L, et al. Feature selection with dynamic mutual information [J]. Pattern Recognition, 2009,42 (7) : 1330-1339.
  • 4Hall M A. Correlation-based feature selection for machine learning[D]. Hamilton, New Zealand: The University of Waikato, 1999.
  • 5洪智勇,刘灿涛,邓宝林.基于二次Renyi熵的正则化互信息特征选择方法[J].计算机应用,2010,30(5):1273-1276. 被引量:7
  • 6Cover T M,Thomas J A [著],阮吉寿,张华[译].信息论基础.北京:机械工业出版社,2008.10-11.
  • 7饶丽丽,刘雄辉,张东站.基于特征相关的改进加权朴素贝叶斯分类算法[J].厦门大学学报(自然科学版),2012,51(4):682-685. 被引量:30
  • 8李方,刘琼荪.基于改进属性加权的朴素贝叶斯分类模型[J].计算机工程与应用,2010,46(4):132-133. 被引量:12
  • 9Witten I H,Frank E.数据挖掘实用机器学习技术[M].北京:机械工业出版社,2006

二级参考文献23

  • 1徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量:56
  • 2程克非,张聪.基于特征加权的朴素贝叶斯分类器[J].计算机仿真,2006,23(10):92-94. 被引量:40
  • 3罗海飞,吴刚,杨金生.基于贝叶斯的文本分类方法[J].计算机工程与设计,2006,27(24):4746-4748. 被引量:14
  • 4章舜仲,王树梅,黄河燕,陈肇雄.基于属性相关性分析的贝叶斯分类模型[J].情报学报,2007,26(2):271-274. 被引量:11
  • 5BATTITI R.Using mutual information for selecting features in supervised neural net learning[J].IEEE Transactions on Neural Networks,1994,5 (4):537-550.
  • 6KWAK N,CHOI C H.Input feature,selection for classification problems[J].IEEE Transactions on Neural Networks,2002,3 (1):143-159.
  • 7PENG H,LONG F,DING C.Feature selection based on mutual information:Criteria of max-dependency,max-relevance and min-redundancey[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(8):1226-1238.
  • 8KWAK N,CHOI C H.Input feature selection for classification problems[J].IEEE Transactions on Neural Networks,2002,3 (1):143-159.
  • 9ESTEVEZ P A,TESMER M,PEREZ C A.Normalized mutual information feature selection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,20(2):189-201.
  • 10HILD K E,ERDOGMUS D,TORKKOLA K,et al.Feature extraction using information theoretic learning[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(9):1385-1392.

共引文献59

同被引文献31

引证文献6

二级引证文献38

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部