改进的朴素贝叶斯增量算法研究被引量：11

Improved incremental algorithm of Naive Bayes

下载PDF

导出

摘要提出了一种新增特征的朴素贝叶斯增量算法。在无标注语料增量样本的选择上,借助传统的类置信度阈值,构建一个最小后验概率作为样本选择的双阈值,当识别到增量语料中有新的特征时,会将该特征加入到特征空间,并对分类器进行相应的更新,发现对类置信度阈值起到很好的补充作用,最后利用了无标注和有标注语料验证所提算法。实验结果表明,改进的朴素贝叶斯增量算法较传统增量算法表现出了更优的增量学习效果。 A novel Naive Bayes incremental algorithm was proposed, which could select new features. For the incre- mental sample selection of the unlabeled corpus, a minimum posterior probability was designed as the double threshold of sample selection by using the traditional class confidence. When new feature was detected in the corpus, it would be mapped into feature space, and then the corresponding classifier was updated. Thus this method played a very important role in class confidence threshold. Finally, it took advantage of the unlabeled and annotated corpus to validate improved incremental algorithm of Naive Bayes. The experimental results show that an improved incremental algorithm of Naive Bayes significantly outperforms traditonal incremental algorithm.

作者曾谁飞张笑燕杜晓峰陆天波

机构地区北京邮电大学软件学院北京邮电大学计算机学院

出处《通信学报》 EI CSCD 北大核心 2016年第10期81-91,共11页 Journal on Communications

关键词朴素贝叶斯增量算法特征空间评价指标 Naive Bayes, incremental algorithm, feature space, evaluation index

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献22

1CHRISTOPHER M. Pattern recognition and machine learning[M]. New York: Springer, 2006.
2ESCALANTE H J, MORALES E F, SUCAR L E. A Naive Bayes baseline for early gesture recognition[J]. Pattern Recognition Letters, 2016, 73: 91-99.
3DIMKOVSKI M,AN A. A Bayesian model for canonical circuits in the neocortex for parallelized and incremental learning of symbol repre- sentations[J]. Neurocomputing, 2015, 149: 1270-1279.
4FENG L,WANG Y, ZUO W. Quick online spam classification method based on active and incremental learning[J].Journal of Intelligent & Fuzzy Systems,2015,30(1): 17-27.
5董立岩,隋鹏,孙鹏,李永丽.基于半监督学习的朴素贝叶斯分类新算法[J].吉林大学学报（工学版）,2016,46(3):884-889. 被引量：15
6李金华,梁永全,吕芳芳.一种加权朴素贝叶斯分类增量学习模型[J].计算机与现代化,2010(5):30-32. 被引量：1
7罗福星,刘卫国.一种朴素贝叶斯分类增量学习算法[J].微计算机应用,2008,29(6):107-112. 被引量：8
8宫秀军,刘少辉,史忠植.一种增量贝叶斯分类模型[J].计算机学报,2002,25(6):645-650. 被引量：55
9高洁,吉根林.一种增量式Bayes文本分类算法[J].南京师范大学学报（工程技术版）,2004,4(3):49-52. 被引量：3
10王小林,镇丽华,杨思春,邰伟鹏,郑啸.基于增量式贝叶斯模型的中文问句分类研究[J].计算机工程,2014,40(9):238-242. 被引量：7

二级参考文献54

1姜卯生,王浩,姚宏亮.朴素贝叶斯分类器增量学习序列算法研究[J].计算机工程与应用,2004,40(14):57-59. 被引量：10
2张宇,刘挺,文勖.基于改进贝叶斯模型的问题分类[J].中文信息学报,2005,19(2):100-105. 被引量：47
3李晓毅,徐兆棣.增量式贝叶斯分类的原理和算法[J].沈阳工业大学学报,2006,28(4):422-425. 被引量：7
4王玉珍.基于贝叶斯理论的分类模式挖掘方法研究[J].微计算机应用,2007,28(6):664-668. 被引量：4
5宫秀军史忠植.基于贝叶斯潜在语义模型的半监督Web挖掘[J].软件学报，已录用,.
6周明孙树栋.遗传算法原理及应用[M].北京：国防工业出版社,1996..
7Domingos P, Pazzani M, On the Optimality of the Simple Bayesian Classifier under Zero - One Loss. Machine Learning, 1997,29 (2 -3) :103 - 130
8Yager R. An extension of the naive Bayesian classifier. Information Sciences,2006,176:577-588
9Mc Callum A, Nigam K. A comparison of Event Models for Naive Bayes Text Classification. AAAI -98 Workshop on Learning for Text Categorization, Madison, Wisconsim : AAAI Press, 1998,509 - 516
10Nadeem Ahmed, Syed Huan. Incremental learning with support vector machines, IJCAI[ c ] ,Stockholm,Sweden, 1999.

共引文献82

1姜卯生,王浩,姚宏亮.朴素贝叶斯分类器增量学习序列算法研究[J].计算机工程与应用,2004,40(14):57-59. 被引量：10
2杨森,徐海涛,柴乔林.应用支持向量机实现增量入侵检测[J].计算机工程与应用,2004,40(27):142-143. 被引量：1
3张晓辉,李莹,常桂然,赵宏.适于Internet新闻文本实时分类的动态向量空间模型DVSM[J].计算机科学,2004,31(6):64-67. 被引量：1
4李家春,李之棠.分布式入侵告警关联分析[J].计算机研究与发展,2004,41(11):1919-1923. 被引量：6
5王利民,苑森淼.具有抗噪音能力的增量式混合贝叶斯网络[J].仪器仪表学报,2005,26(3):221-225. 被引量：1
6钱玲飞,刘玉树,李侃.朴素贝叶斯分类器在地形评估中的应用方法[J].计算机工程与应用,2005,41(12):189-191. 被引量：6
7王小英,赵海,林涛,张文波,尹震宇.基于信任的普适计算服务选择模型[J].通信学报,2005,26(5):1-8. 被引量：17
8田相军,罗琳.综合图像灰度熵和灰度值的人脸识别方法[J].现代电子技术,2005,28(24):46-48. 被引量：3
9胡学钢,郭亚光.一种基于粗糙集的朴素贝叶斯分类算法[J].合肥工业大学学报（自然科学版）,2006,29(2):169-172. 被引量：11
10周俐霞,何安元.基于流量均衡的垃圾邮件过滤网关集群系统模型[J].盐城工学院学报（自然科学版）,2006,19(1):23-27. 被引量：2

同被引文献101

1杨炳儒,邵阔义,宋泽锋,张克君.基于高性能特征选择函数的Web文档聚类算法[J].计算机应用研究,2009,26(2):631-633. 被引量：2
2刘青,何政.结合EM算法的朴素贝叶斯方法在中文网页分类上的应用[J].计算机工程与科学,2005,27(7):65-66. 被引量：4
3张葛祥,胡来招,金炜东.基于熵特征的雷达辐射源信号识别[J].电波科学学报,2005,20(4):440-445. 被引量：60
4马忠林,赵旭东.基于经验的铝电解生产专家系统[J].轻金属,2006(2):33-35. 被引量：3
5农国武.基于BP神经网络的铝电解槽热平衡控制系统[J].轻金属,2006(8):47-50. 被引量：3
6程克非,张聪.基于特征加权的朴素贝叶斯分类器[J].计算机仿真,2006,23(10):92-94. 被引量：40
7邓维斌,王国胤,王燕.基于Rough Set的加权朴素贝叶斯分类算法[J].计算机科学,2007,34(2):204-206. 被引量：43
8付辉.模糊C-均值(FCM)聚类算法的改进[J].科学技术与工程,2007,7(13):3121-3123. 被引量：11
9张鹏,唐世渭.朴素贝叶斯分类中的隐私保护方法研究[J].计算机学报,2007,30(8):1267-1276. 被引量：19
10张明卫,王波,张斌,朱志良.基于相关系数的加权朴素贝叶斯分类算法[J].东北大学学报（自然科学版）,2008,29(7):952-955. 被引量：32

引证文献11

1符颖,王星,周一鹏,范翔宇.基于改进半监督朴素贝叶斯的LPI雷达信号识别[J].系统工程与电子技术,2017,39(11):2463-2469. 被引量：7
2潘峻岚,束红,程予希.基于动态赋能的智能家居网络安全防御系统设计研究[J].电脑知识与技术,2019,15(2):45-47. 被引量：2
3钟新成.基于特征加权的朴素贝叶斯学情预警分类研究[J].山西大同大学学报（自然科学版）,2019,35(2):46-49. 被引量：2
4陈勇,周晓锋,李帅.铝电解关键指标预测方法的研究与应用[J].计算机工程与应用,2019,55(12):250-258.
5许文杰,束红.基于MOOC平台的学习监督系统设计与研究[J].电脑知识与技术,2019,15(8):99-100.
6任春华,孙林夫.面向协作企业群的三阶段主客观公平权重动态评价[J].计算机集成制造系统,2019,25(11):2874-2891. 被引量：8
7彭革.基于朴素贝叶斯算法在垃圾邮件过滤中的研究综述[J].电脑知识与技术,2020,16(14):244-245. 被引量：2
8邱宁佳,贺金彪,薛丽娇,王鹏,赵建平.融合语义特征的加权朴素贝叶斯分类算法[J].计算机工程与设计,2020,41(9):2523-2529. 被引量：6
9孙毅,石墨.面向新能源消纳的热水器负荷态势观测器模型[J].电网技术,2020,44(10):3821-3828. 被引量：2
10王红卫,董鹏宇,陈游,周一鹏,肖冰松.半监督条件下基于朴素贝叶斯和Choi-Williams时频分布能量积累的雷达信号识别[J].电子与信息学报,2021,43(3):589-597. 被引量：7

二级引证文献37

1童威,黄启萍.加权朴素贝叶斯算法在消防检测中的应用[J].西安工程大学学报,2019,33(1):111-115. 被引量：4
2刘赢,田润澜,王晓峰.基于深层卷积神经网络和双谱特征的雷达信号识别方法[J].系统工程与电子技术,2019,41(9):1998-2005. 被引量：26
3冉小辉,朱卫纲.基于自适应邻居局部与全局一致性的雷达辐射源识别[J].电子设计工程,2019,27(17):28-32. 被引量：3
4杨洁,张欢.基于改进型AlexNet的LPI雷达信号识别[J].现代电子技术,2020,43(5):57-60. 被引量：8
5李娜,张玉霞,刘艳辉.复杂环境下激光雷达信号的模式识别研究[J].激光杂志,2020,41(11):130-133. 被引量：1
6刘鹏程,孙林夫,张常有.融合组合赋权与嵌套集成分类器的服务商评价[J].计算机集成制造系统,2020,26(12):3408-3426. 被引量：3
7冯军军,李力.机器学习在垃圾邮件过滤中的实现[J].电脑知识与技术,2021,17(8):154-155. 被引量：2
8冯军军,李力.垃圾邮件检测与绕过技术的研究[J].电脑知识与技术,2021,17(7):36-37. 被引量：1
9余洋,孙林夫,任春华,韩敏.面向多服务价值链的业务资源双边匹配模型[J].计算机集成制造系统,2021,27(5):1397-1409. 被引量：9
10夏常明.基于朴素贝叶斯算法的电网建设资源自动化分类模型研究[J].粘接,2021(12):93-97. 被引量：2

1杜晓明,代逸生.基于分辨矩阵和Apriori算法的关联规则挖掘研究与应用[J].中国科技论文,2015,10(20):2369-2372. 被引量：3
2崔彦君.商品交易数据关联规则挖掘在R中的实现[J].广东培正学院论丛,2016,16(4):62-66.
3崔彦君.R语言在商品交易数据关联规则挖掘中的应用[J].内蒙古科技与经济,2017(1):100-102. 被引量：1
4韩明涛.时间序列模式挖掘的算法研究[J].山东大学学报（工学版）,2004,34(3):88-91. 被引量：4
5王秀枝,安建成.基于支持度和置信度智能优化的关联分类算法[J].计算机应用与软件,2013,30(11):184-186. 被引量：8
6朱俚治.一种基于MMTD的检测DDoS攻击算法[J].计算机安全,2014(8):21-24.
7牛立尚.一种基于统计特征的孤立点和边缘点检测算法[J].信息技术,2015,39(6):112-114. 被引量：2
8吴磊,岳耀.高校毕业生就业信息交互新途径——手机网络[J].中国科技信息,2011(16):175-175. 被引量：2
9朱俚治.一种基于粗糙集的网络攻击检测算法[J].计算机与数字工程,2015,43(9):1630-1633.
10王玉锋,范明钰,王绪本,徐海梅.入侵检测系统的研究[J].计算机仿真,2004,21(5):99-102. 被引量：8

通信学报

2016年第10期

浏览历史

内容加载中请稍等...

改进的朴素贝叶斯增量算法研究被引量：11

参考文献22

二级参考文献54

共引文献82

同被引文献101

引证文献11

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

改进的朴素贝叶斯增量算法研究 被引量：11

参考文献22

二级参考文献54

共引文献82

同被引文献101

引证文献11

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

改进的朴素贝叶斯增量算法研究被引量：11