基于特征加权的朴素贝叶斯分类器被引量：40

Naive Bayesian Classiflers Using Feature Weighting

下载PDF

导出

摘要朴素贝叶斯分类器是一种广泛使用的分类算法,其计算效率和分类效果均十分理想。但是,由于其基础假设“朴素贝叶斯假设”与现实存在一定的差异,因此在某些数据上可能导致较差的分类结果。现在存在多种方法试图通过放松朴素贝叶斯假设来增强贝叶斯分类器的分类效果,但是通常会导致计算代价大幅提高。该文利用特征加权技术来增强朴素贝叶斯分类器。特征加权参数直接从数据导出,可以看作是计算某个类别的后验概率时,某个属性对于该计算的影响程度。数值实验表明,特征加权朴素贝叶斯分类器(FNVNB)的效果与其他的一些常用分类算法,例如树扩展朴素贝叶斯(TAN)和朴素贝叶斯树(NBTree)等的分类效果相当,其平均错误率都在17％左右;在计算速度上,FWNB接近于NB,比TAN和NBTree快至少一个数量级。 Naive Bayesian classifiers are widely used in machine learning due to their computational efficiency and competitive accuracy. However, their conditional attribute independence assumption can result in bad performance in real world problems. A number of techniques have explored the simple relaxations of the attribute independence assumption to increase accuracy, but always cost much more computing time. In this paper, we investigate enhancement of naive Bayes classifier using feature weighting technique. The feature weighting coefficients are directly induced from dataset, and can be regarded as the significance of each attribute when evaluating the posterior probability of the particular class value. Experiment results show that the new algorithm — Feature Weighting Naive Bayes（FWNB） can reach the same classification performance as state - of - the - art classifiers like TAN and NBTree, and all the mean error rate are around 18 percent, but the train time of FWNB is reduced at lear one quantitative level.

作者程克非张聪

机构地区重庆邮电学院计算机科学系重庆交通学院计算机科学系

出处《计算机仿真》 CSCD 2006年第10期92-94,150,共4页 Computer Simulation

关键词贝叶斯分类器朴素贝叶斯分类器特征加权 Bayesian classification Naive Bayesian classification Feature weighting

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1M Pankaj and W W Benjamin. Artificial neural networks:concepts and theory[M]. Los Alamitos, Calif. : IEEE Computer Society Press,1992.
2J R Quinlan. C4.5: programs for machine learning[M]. San Mateo, Calif. : Morgan Kaufmann Publishers,1993.
3R O Duda, P E Hart, D G Stork. Pattern Classification(2nd Edition) [ M]. Wiley - Interscience. 2000.
4P Langley, W Iba and K Thompson. An analysis of bayesian classifiers[ C ]. In AAAI ' 90,1992. 223 - 228.
5M Jaeger. Probabilistic Classifiers and the Concepts They Recognize[ C]. ICML 2003. 266 - 273
6N Friedman, D Geiger and M Goldszmidt. Bayesian Network Classifiers[J]. Machine Learning, Kluwer Academic Publishers, Boston, 1997,29:131 - 163.
7I Kononenko. Semi naive Bayesian classifier[C].Proceedings of European Conference on Artificial Intelligence,1991. 206 - 219.
8P Langley and S Sage. Induction of selective Bayesian classifiers[C]. Proceedings of the Tenth Conference on Uncertainty in Artificial Intelligence. 1994, pp. 339 - 406.Seattle, WA: Morgan Kaufmann.
9G I Webb & M J Pazzani. Adjusted probability naive Bayesian induction[C]. Proceedings of the Eleventh Australian Joint Conference on Artificial Intelligence. 1998, pp. 285 - 295.Berlin: Springer - Verlag.
10R Kohavi. Scaling up the accuracy of naive - Bayes classifiers: A decision - tree hybrid[C]. Proceedings of the Second International Conference on Knowledge Discovery and Data Mining. 1996, pp. 202 -207. Menlo Park, CA: TheAAAI Press.

同被引文献264

1安艳辉,董五洲,游自英.基于改进的朴素贝叶斯文本分类研究[J].河北省科学院学报,2007,24(1):22-25. 被引量：7
2刘伟辉,王丽珍.基于多关系的空间分类算法研究[J].云南大学学报（自然科学版）,2006,28(S1):158-163. 被引量：4
3张庆彬,吴惕华,刘波.自适应实值分布估计算法[J].清华大学学报（自然科学版）,2008,48(S2):1859-1862. 被引量：3
4刘怀亮,张治国,马志辉,孙蕾.基于SVM与KNN的中文文本分类比较实证研究[J].情报理论与实践,2008,31(6):941-944. 被引量：10
5王双成,苑森淼.具有丢失数据的贝叶斯网络结构学习研究[J].软件学报,2004,15(7):1042-1048. 被引量：62
6余芳,姜云飞.一种基于朴素贝叶斯分类的特征选择方法[J].中山大学学报（自然科学版）,2004,43(5):118-120. 被引量：24
7卢效峰,郑权.基于用户行为分析的搜索引擎模型[J].北方工业大学学报,2004,16(3):13-16. 被引量：6
8王静红,李笔.基于决策树的一种改进算法[J].电讯技术,2004,44(5):175-178. 被引量：4
9程泽凯,林士敏,陆玉昌,蒋望东,陆小艺.基于Matlab的贝叶斯分类器实验平台MBNC[J].复旦学报（自然科学版）,2004,43(5):729-732. 被引量：27
10袁莉,刘宏伟,保铮.基于中心矩特征的雷达HRRP自动目标识别[J].电子学报,2004,32(12):2078-2081. 被引量：32

引证文献40

1秦锋,任诗流,程泽凯,罗慧.基于属性加权的朴素贝叶斯分类算法[J].计算机工程与应用,2008,44(6):107-109. 被引量：48
2刘承启,邓庚盛,江婕,徐健锋.基于用户行为分析的搜索引擎研究[J].计算机与现代化,2008(9):75-77. 被引量：2
3徐庆,王秀春,李青.基于高分辨一维像的目标特征提取方法[J].现代雷达,2009,31(6):60-63. 被引量：18
4李方,刘琼荪.基于改进属性加权的朴素贝叶斯分类模型[J].计算机工程与应用,2010,46(4):132-133. 被引量：12
5杜会锋,刘琼荪.基于Copula的贝叶斯分类器[J].计算机工程与应用,2010,46(10):111-112. 被引量：3
6张林,石洪波.基于主成分分析朴素贝叶斯和决策树比较[J].电脑知识与技术,2010,6(1):222-224. 被引量：3
7李雪莲.基于PLS的加权朴素贝叶斯分类测试算法[J].电子质量,2010(7):4-6. 被引量：4
8王国才,张聪.一种基于粗糙集的特征加权朴素贝叶斯分类器[J].重庆理工大学学报（自然科学）,2010,24(7):86-90. 被引量：7
9张雯,张化祥.属性加权的朴素贝叶斯集成分类器[J].计算机工程与应用,2010,46(29):144-146. 被引量：10
10张春英,王晶.一种新型加权朴素贝叶斯分类算法[J].微计算机信息,2010,26(30):222-223. 被引量：3

二级引证文献204

1马飞虎,曾聪,金依辰,孙翠羽,陈华鹏.一种基于属性加权朴素贝叶斯算法的OTSU图像分割方法[J].应用科学学报,2022,40(2):224-232. 被引量：8
2蒋云钟,冶运涛,赵红莉,梁犁丽,曹引,顾晶晶.水利大数据研究现状与展望[J].水力发电学报,2020,39(10):1-32. 被引量：80
3杜会锋,刘琼荪.基于Copula的贝叶斯分类器[J].计算机工程与应用,2010,46(10):111-112. 被引量：3
4李雪莲.基于PLS的加权朴素贝叶斯分类测试算法[J].电子质量,2010(7):4-6. 被引量：4
5金祖旭,李敏波.基于用户反馈的搜索引擎排名算法[J].计算机系统应用,2010,19(11):60-65. 被引量：3
6王晶,张春英.关系学习中贝叶斯分类算法的比较研究[J].河北理工大学学报（自然科学版）,2011,33(1):91-94. 被引量：6
7王福枝,周忠眉.基于属性值贡献率的朴素贝叶斯改进算法[J].漳州师范学院学报（自然科学版）,2010,23(4):42-44.
8李雪莲.基于EM-PLS的加权朴素贝叶斯分类算法[J].重庆工商大学学报（自然科学版）,2011,28(1):22-25. 被引量：1
9张震,胡学钢.基于互信息量的分类模型[J].计算机应用,2011,31(6):1678-1680. 被引量：5
10刘牛.基于属性加权的朴素贝叶斯分类算法改进[J].网络安全技术与应用,2011(6):72-74. 被引量：6

1秦锋,任诗流,程泽凯,罗慧.基于属性加权的朴素贝叶斯分类算法[J].计算机工程与应用,2008,44(6):107-109. 被引量：48
2章伟雄.关于启发式搜索中加权技术有效性的一个注记[J].上海交通大学学报,1989,23(5):109-112.
3冯少荣,肖文俊.基于样本选取的决策树改进算法[J].西南交通大学学报,2009,44(5):643-647. 被引量：18
4周智刚.一种改进的CHNN图像边缘检测方法研究[J].计算机应用与软件,2011,28(5):255-258.
5刘双强.一种改进的图像边缘检测方法——Weighted CHNN[J].微电子学与计算机,2011,28(9):100-103. 被引量：2
6缪丹权,郑河荣,顾国民.基于优化加权参数的AdaBoost人脸检测算法[J].计算机工程与应用,2014,50(19):173-177. 被引量：6
7赵宝江,李士勇.基于蚁群聚类算法的非线性系统辨识[J].控制与决策,2007,22(10):1193-1196. 被引量：2
8王毅,王创新,卢进,盛文正.基于HSV模型和改进AdaBoost算法的车牌检测[J].电子科技,2015,28(2):107-111. 被引量：6
9赵广复,张有顺.一种改进的CHNN图像边缘检测方法—Weighted CHNN[J].计算机应用与软件,2012,29(5):256-259.
10张曙光.浅析信息技术环境下CIO的地位[J].天津科技,2009,36(3):93-94.

计算机仿真

2006年第10期

浏览历史

内容加载中请稍等...

基于特征加权的朴素贝叶斯分类器被引量：40

参考文献15

同被引文献264

引证文献40

二级引证文献204

相关作者

相关机构

相关主题

浏览历史

基于特征加权的朴素贝叶斯分类器 被引量：40

参考文献15

同被引文献264

引证文献40

二级引证文献204

相关作者

相关机构

相关主题

浏览历史

基于特征加权的朴素贝叶斯分类器被引量：40