用平滑方法改进多关系朴素贝叶斯分类被引量：9

Improving multi- relational Naive Bayesian classifier using smoothing methods

下载PDF

导出

摘要为消除朴素贝叶斯分类时的零概率以及过度拟合问题,分析了各种概率平滑方法,给出了基于M估计的多关系朴素贝叶斯分类方法(MRNBC-M)和基于Laplace估计的多关系朴素贝叶斯分类方法(MRNBC-L),分析探讨了M平滑和Laplace平滑方法对多关系分类的影响情况,为进一步优化分类,方法基于扩展互信息标准对数据进行属性过滤。多关系标准数据集上的实验显示,MRNBC-M可以有效改进分类性能。 To eliminate the naive Bayesian classification of zero probability and overfitting problem, this paper discusses the various probability smoothing method, gives MRNBC-M(Multi-Relational Naive Bayesian Classifier based on Mestimation)and MRNBC- L(Multi-Relational Naive Bayesian Classifier based on Laplace- estimation). In the case of multi-relationship, the impact of M and Laplace estimation methods on the classification is analyzed. In order to further optimize the classification, the method is based on the extended mutual information criterion. Experiments on the multirelational datasets show that MRNBC-M can effectively improve the classification performance.

作者徐光美刘宏哲张敬尊王金华 XU Guangmei;LIU Hongzhe;ZHANG Jingzun;WANG Jinhua(College of Information Technology, Beijing Union University, Beijing 100101, China;Beijing Key Laboratory of Information Service Engineering, Beijing Union University, Beijing 100101, China)

机构地区北京联合大学信息学院北京联合大学信息服务工程重点实验室

出处《计算机工程与应用》 CSCD 北大核心 2017年第5期69-72,共4页 Computer Engineering and Applications

基金国家自然科学基金(No.61372148 No.61202245) 北京市"长城学者"计划项目(No.CIT&TCD20130320) 北京市优秀人才培养项目(No.2010D005022000011) 北京联合大学自然科学项目(No.zk20201403)

关键词多关系数据挖掘朴素贝叶斯参数平滑互信息 Multi-Relational Data Mining(MRDM) Naive Bayes smoothing methods mutual information

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1Mitat Poyraz,Zeynep Hilal Kilimci,Murat Can Ganiz.Higher-Order Smoothing: A Novel Semantic Smoothing Method for Text Classification[J].Journal of Computer Science & Technology,2014,29(3):376-391. 被引量：3

二级参考文献38

1Taskar B, Abbeel P, Koller D. Discriminative probabilistic models for relational data. In Proc. the 18th Conf. Uncer- tainty in Artificial Intelligence, August 2002, pp.485-492.
2Chakrabarti S, Dom B, Indyk P. Enhanced hypertext catego- rization using hyperlinks. In Proc. International Conference on Management of Data, June 1998, pp.307-318.
3Neville J, Jensen D. Iterative classification in relational data. In Proc. AAAI 2000 Workshop on Learning Statistical Mod- els from Relational Data, July 2000, pp.13-20.
4Getoor L, Diehl C P. Link mining: A survey. ACM SIGKDD Explorations Newsletter, 2005, 7(2): 3-12.
5Ganiz M C, Kanitkar S, Chuah M C, Pottenger W M. Detec- tion of interdomain routing anomalies based on higher-order path analysis. In Proc. the 6th IEEE International Confer- ence on Data Mining, December 2006, pp.874-879.
6Ganiz M C, Lytkin N, Pottenger W M. Leveraging higher or- der dependencies between features for text classification. In Proc. European Conference on Machine Learning and Prin- ciples and Practice of Knowledge Discovery in Databases, September 2009, pp.375-390.
7Ganiz M C, George C, Pottenger W M. Higher order Naive Bayes: A novel non-IID approach to text classification. IEEE Trans. Knowledge and Data Engineering, 2011, 23(7): 1022- 1034.
8Lytkin N. Variance-based clustering methods and higher or- der data transformations and their applications [Ph.D. The- sis]. Rutgers University, N J, 2009.
9Edwards A, Pottenger W M. Higher order Q-Learning. In Proc. IEEE Syrup. Adaptive Dynamic Programming and Re- inforcement Learning, April 2011, pp.128-134.
10Deerwester S C, Dumais S T, Landauer T K et al. Indexing by latent semantic analysis. Journal of the American Society for information Science, 1990, 41(6): 391-407.

共引文献2

1罗邦慧,曾剑平,段江娇,吴承荣.基于情感模型的文本意见分类方法[J].计算机工程,2015,41(5):175-179. 被引量：4
2Zheng Zhang,Shu Zhou.Research on Feature Extraction Method of Social Network Text[J].Journal of New Media,2021,3(2):73-80. 被引量：2

同被引文献74

1王方伟,杨少杰,赵冬梅,王长广.基于改进TF-IDF的多态蠕虫特征自动提取算法[J].华中科技大学学报（自然科学版）,2020,48(2):79-84. 被引量：3
2金连,王宏志,黄沈滨,高宏.基于Map-Reduce的大数据缺失值填充算法[J].计算机研究与发展,2013,50(S1):312-321. 被引量：18
3苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：381
4谢斌.朴素贝叶斯分类在数据挖掘中的应用[J].甘肃联合大学学报（自然科学版）,2007,21(4):79-82. 被引量：12
5张鹏,唐世渭.朴素贝叶斯分类中的隐私保护方法研究[J].计算机学报,2007,30(8):1267-1276. 被引量：19
6范小丽,刘晓霞.文本分类中互信息特征选择方法的研究[J].计算机工程与应用,2010,46(34):123-125. 被引量：30
7李梦瑶.中国污染场地环境管理存在的问题及对策[J].中国农学通报,2010,26(24):338-342. 被引量：22
8张顺利,邱雪松,孟洛明.网络虚拟化环境下的服务故障诊断算法[J].软件学报,2012,23(10):2772-2782. 被引量：11
9贾娴,刘培玉,公伟.基于改进属性加权的朴素贝叶斯入侵取证研究[J].计算机工程与应用,2013,49(7):81-84. 被引量：7
10胡勤,陈琛,刘敏.早期火灾发生区域检测算法研究[J].消防科学与技术,2013,32(12):1391-1393. 被引量：5

引证文献9

1邓广彪,黄振功,岳晓光.基于Nesterov平滑的高阶路径朴素贝叶斯文本隐式分类研究[J].西南师范大学学报（自然科学版）,2018,43(7):107-112. 被引量：2
2孙子杰.基于朴素贝叶斯的新闻分类改进[J].电子制作,2018,26(22):37-39. 被引量：3
3童威,黄启萍.加权朴素贝叶斯算法在消防检测中的应用[J].西安工程大学学报,2019,33(1):111-115. 被引量：4
4谭翔纬,程学军.基于信息粒数据重构的多关系数据聚类仿真[J].计算机仿真,2020,37(6):406-409. 被引量：1
5黄国鑫,朱守信,王夏晖,田梓,季国华,卢然,崔轩,陈茜.基于自然语言处理和机器学习的疑似土壤污染企业识别[J].环境工程学报,2020,14(11):3234-3242. 被引量：6
6徐军.基于深度学习的财务异常数据智能分析方法研究[J].电子设计工程,2021,29(16):149-152. 被引量：6
7罗锦光,杨鸣坤,苏锦.基于GEP-NBC算法的Android恶意应用静态检测[J].信息与电脑,2021,33(16):62-66.
8段敏慧,姜瑛.云计算环境下服务故障模型动态建立[J].小型微型计算机系统,2022,43(4):889-896. 被引量：4
9朱鑫洋,迟呈英,战学刚.基于Transformer的英文粘连词还原方法[J].计算机应用与软件,2023,40(8):45-49.

二级引证文献26

1许长敏,曾丽明.7种杀菌剂防治马铃薯晚疫病药效试验[J].福建农业科技,2000,31(2):10-11. 被引量：1
2周聪,张德林.基于机器学习的图书智能采编模式的构建[J].中华医学图书情报杂志,2018,27(12):43-49. 被引量：6
3钟熙,孙祥娥.基于Kmeans++聚类的朴素贝叶斯集成方法研究[J].计算机科学,2019,46(B06):439-441. 被引量：24
4董杰盛.自然语言处理在新闻分类中的应用[J].科学咨询,2019,0(39):12-14. 被引量：2
5宋晓博.HHM-BN的某型发动机燃油附件制造风险评估[J].空军工程大学学报（自然科学版）,2019,20(5):16-21.
6崔炎炎,刘立新.基于大数据的P2P网络借贷平台风险评价[J].统计与信息论坛,2020,35(4):42-51. 被引量：7
7徐兵,石少青,陈超.基于自然语言的中文地址匹配研究[J].电子设计工程,2020,28(16):7-10. 被引量：4
8蒋礼青,胡振宇,方媛.基于鲸鱼优化算法的贝叶斯分类器研究与应用[J].电信工程技术与标准化,2021,34(1):86-92. 被引量：2
9杨烁.人工智能在电视台安全播出中的应用[J].新闻文化建设,2021(3):100-101.
10朱林.云计算环境下故障感知系统设计[J].电脑编程技巧与维护,2021(9):129-130.

1刘金红,陆余良.基于Ontology改进的N-Gram文本分类模型研究[J].计算机工程与设计,2007,28(13):3213-3215. 被引量：3
2韦凌翔,陈红,王永岗,张敏,王龙飞.基于相关向量机的短时交通流量平滑处理方法[J].西北大学学报（自然科学版）,2017,47(1):38-42. 被引量：1
3张晶,毕佳佳,刘炉.基于mRMR的多关系朴素贝叶斯分类[J].计算机应用与软件,2016,33(8):57-61. 被引量：5
4陈叶旺,余金山.一种改进的朴素贝叶斯文本分类方法[J].华侨大学学报（自然科学版）,2011,32(4):401-404. 被引量：11
5杜选.基于加权补集的朴素贝叶斯文本分类算法研究[J].计算机应用与软件,2014,31(9):253-255. 被引量：13
6刘洁彬,宋茂强,赵方,杨志宇.基于上下文的二阶隐马尔可夫模型[J].计算机工程,2010,36(10):231-232. 被引量：6
7崔维,郭景峰,张文元,王妍妍,高爱华.一种有效率的关系朴素贝叶斯分类算法[J].科学技术与工程,2008,8(16):4706-4708.
8毕佳佳,张晶.基于关系选择的多关系朴素贝叶斯分类[J].计算机工程,2016,42(5):218-223. 被引量：5
9黄建中,王肖雷.Katz平滑算法在中文分词系统中的应用[J].计算机工程,2004,30(B12):371-372. 被引量：5
10周新栋,王挺.基于N元语言模型的文本分类方法[J].计算机应用,2005,25(1):11-13. 被引量：11

计算机工程与应用

2017年第5期

浏览历史

内容加载中请稍等...

用平滑方法改进多关系朴素贝叶斯分类被引量：9

参考文献1

二级参考文献38

共引文献2

同被引文献74

引证文献9

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

用平滑方法改进多关系朴素贝叶斯分类 被引量：9

参考文献1

二级参考文献38

共引文献2

同被引文献74

引证文献9

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

用平滑方法改进多关系朴素贝叶斯分类被引量：9