期刊文献+

基于代价敏感的朴素贝叶斯不平衡数据分类研究 被引量:21

Naive Bayes Classification Algorithm Based on Cost Sensitive for Imbalanced Data Distribution
下载PDF
导出
摘要 传统数据挖掘分类算法在不平衡数据集上分类效果不佳,可以将代价敏感思想与传统分类算法相结合解决不平衡数据分类问题.但在代价敏感学习中,代价的确定需要足够的先验知识,难以把握.针对上述不足,构造针对不平衡数据分布的自适应代价函数,引进全局代价矩阵,对传统的朴素贝叶斯分类算法进行改进.在UCI数据集上的实验结果表明,提出的基于代价敏感的朴素贝叶斯分类算法对于不平衡数据分类是有效可行的. 传统数据挖掘分类算法在不平衡数据集上分类效果不佳,可以将代价敏感思想与传统分类算法相结合解决不平衡数据分类问题.但在代价敏感学习中,代价的确定需要足够的先验知识,难以把握.针对上述不足,构造针对不平衡数据分布的自适应代价函数,引进全局代价矩阵,对传统的朴素贝叶斯分类算法进行改进.在UCI数据集上的实验结果表明,提出的基于代价敏感的朴素贝叶斯分类算法对于不平衡数据分类是有效可行的.
出处 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期387-390,共4页 Journal of Computer Research and Development
基金 国家自然科学基金项目(60673191 61070061) 广东省自然科学基金项目(9151026005000002)
关键词 代价敏感 朴素贝叶斯 不平衡数据分类 cost-sensitive naive bayes imbalanced data classification
  • 相关文献

参考文献1

二级参考文献9

  • 1Agarwal R, Joshi M V. PNrule:A new Frameworkfor Learning Classifier Models in Data Mining (A Case- Study in Network Intrusion Detection)[A]. In Proc. of the First SIAM Conference on Data Mining[ C]. Chicago, USA: [ s. n. ], 2001.
  • 2Alhanmady H, Ramamohanarao K. The Application of Emerging Patterns for Improving the Quality of Rare - class Classification[ A]. In Proc. of the 8th Pacific- Asia Conf. on Advances in Knowledge Discovery and Data Mining( PAKDD2004 ) [ C ].Sydney,Australia: [s. n. ] ,2004. 207 - 211.
  • 3Dong G, Li J. Efficient mining of emerging patterns: Discovering trends and differences[ A]. In Proc. of KDD' 99[ C]. San-Diego,USA: [s. n. ], 1999.15 - 18.
  • 4Fan H, Ramamohanarao K. Bayesian Approach to use Emerging Patterns for Classification[A]. In Proc of 14th Australasian Database Conference[C]. Adelaide, Australia: [s. n. ] ,2003.39- 48.
  • 5范明 魏芳.挖掘基本显露模式用于分类[J].计算机科学,2004,31:207-309.
  • 6Blake C, Merz C. UCI repository of machine learning databases [ EB/OL]. http://www. ics. uri. edu/mlearn/ MLRepository.html. 1998.
  • 7Li W,HanJ,Pei J. CMAR:Accurate and efficient classification based on multiple class - association rules[ A]. In ICDM' 01[C]. San Jose,CA: [s. n. ] ,2001. 369 - 376.
  • 8Dong G,Zhang X,Wong L,et al. CAEP:Classification by Aggregating emerging patterns[A]. In Proc. of the 2nd Int'lConf. On Discovery Science (DS'99)[C]. Tokyo,Japan: [s.n. ], 1999.30 - 42.
  • 9范明,牛常勇,朱琰.一种挖掘多维关联规则的有效算法[J].计算机科学,2001,28(11):44-47. 被引量:7

共引文献3

同被引文献182

引证文献21

二级引证文献190

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部