改进的增量贝叶斯模型的研究被引量：2

ON IMPROVED INCREMENTAL BAYESIAN CLASSIFICATION MODEL

下载PDF

导出

摘要传统分类算法的研究主要关注批量学习任务。实际中,带标注样本很难一次性获得。且存储空间开销较大的特点,也使批量学习显现出一定的局限性。因此,需要增量学习来解决该问题。朴素贝叶斯分类器简单、高效、鲁棒性强,且贝叶斯估计理论为其应用于增量任务提供了基础。但现有的增量贝叶斯模型没有对适应新类别作出描述。同时,实验表明类别之间样本数量的不平衡,会严重影响该模型的分类性能。故基于这两个问题,提出对增量贝叶斯模型的改进,增加参数修正公式,使其可适应新出现的类别,并引入最小风险决策思想减轻数据不平衡造成的影响。取UCI数据集进行仿真测试,结果表明改进后的模型可以渐进提高分类性能,并具有适应新类别的能力。 The research o f tra d itio n a l c la ssifica tio n a lgo rithm focuses on the batch lea rn in g tasks. A c tu a lly ,it is not easy to ob tain labe lledsamples once fo r a ll. In a d d itio n , there is certain lim ita tio n in batch le a rning tasks because the cost o f storage space is ra th e r h ig h . T h e re fo re ,incre m en tal le a rning can be referred to as a so lu tio n . N aive B ayesian cla ssifica tio n is s im p le , e ffic ie n t and h ig h ly ro b u s t,b e sid e s,th e theory ofBayesian estim ation lays the fou nda tion fo r its a p p lica tio n in incre m en tal tasks. H ow ever no existing incre m en tal Bayesian m odel has describedthe adaptation to new classes. M o re o ve r,th e experim ent shows that the im balance in num bers o f d iffe re n t samples between classes w ill have agreat im pa ct on the c la ssifica tio n perform ance o f the m odel. T h e re fo re , based on the above two p ro b le m s,w e present to im prove the incre m en talBayesian m odel and to increase o f form ulas o f parameters m o d ifica tio n so as to enable the m odel to adapt to new classes. A lso the idea o f riskdecision m in im isa tio n is introduce d to reduce the im pa ct o f data im ba lance. S im ulatio n is carried out on U C I d a taset, re sult indicates th a t theim proved incre m en tal m odel can im prove the cla ssifica tio n perform ance gra d u a lly and has the a d a p ta b ility to new classes.

作者苏志同李杨 Su Zhitong;Li Yang(College of Computer, North China University of Technology, Beijing 100144 , China)

机构地区北方工业大学计算机学院

出处《计算机应用与软件》 CSCD 2016年第8期254-259,共6页 Computer Applications and Software

基金国家自然科学基金项目(61105045) 中央支持地方专项(PXM2014_014212_000097) 北方工业大学科研人才提升计划项目(CCXZ201303)

关键词机器学习朴素贝叶斯增量学习最小化风险 M achine lea rnin g Naive Bayes Incremental learning Risk minimisation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1宫秀军,刘少辉,史忠植.一种增量贝叶斯分类模型[J].计算机学报,2002,25(6):645-650. 被引量：55

二级参考文献1

1宫秀军史忠植.基于贝叶斯潜在语义模型的半监督Web挖掘[J].软件学报，已录用,.

共引文献54

1姜卯生,王浩,姚宏亮.朴素贝叶斯分类器增量学习序列算法研究[J].计算机工程与应用,2004,40(14):57-59. 被引量：10
2杨森,徐海涛,柴乔林.应用支持向量机实现增量入侵检测[J].计算机工程与应用,2004,40(27):142-143. 被引量：1
3张晓辉,李莹,常桂然,赵宏.适于Internet新闻文本实时分类的动态向量空间模型DVSM[J].计算机科学,2004,31(6):64-67. 被引量：1
4李家春,李之棠.分布式入侵告警关联分析[J].计算机研究与发展,2004,41(11):1919-1923. 被引量：6
5王利民,苑森淼.具有抗噪音能力的增量式混合贝叶斯网络[J].仪器仪表学报,2005,26(3):221-225. 被引量：1
6钱玲飞,刘玉树,李侃.朴素贝叶斯分类器在地形评估中的应用方法[J].计算机工程与应用,2005,41(12):189-191. 被引量：6
7王小英,赵海,林涛,张文波,尹震宇.基于信任的普适计算服务选择模型[J].通信学报,2005,26(5):1-8. 被引量：17
8胡学钢,郭亚光.一种基于粗糙集的朴素贝叶斯分类算法[J].合肥工业大学学报（自然科学版）,2006,29(2):169-172. 被引量：11
9周俐霞,何安元.基于流量均衡的垃圾邮件过滤网关集群系统模型[J].盐城工学院学报（自然科学版）,2006,19(1):23-27. 被引量：2
10方德英,寇纪淞,李萍,秦立栓.IT项目风险管理保障体系设计[J].商业研究,2006(10):51-55. 被引量：12

同被引文献26

1赵卓翔,王轶彤,田家堂,周泽学.社会网络中基于标签传播的社区发现新算法[J].计算机研究与发展,2011,48(S3):8-15. 被引量：37
2虞晓芬,傅玳.多指标综合评价方法综述[J].统计与决策,2004,20(11):119-121. 被引量：508
3王峥.一种改进的神经网络增量学习算法[J].计算机科学,2007,34(6):177-178. 被引量：3
4田民,刘思峰,卜志坤.灰色关联度算法模型的研究综述[J].统计与决策,2008(1):24-27. 被引量：177
5张全新,郑建军,牛振东,原达.贝叶斯分类器集成的增量学习方法[J].北京理工大学学报,2008,28(5):397-400. 被引量：3
6赵耀红,王快妮,钟萍,王来生.快速支持向量机增量学习算法[J].计算机工程与设计,2010,31(1):161-163. 被引量：8
7许明英,尉永清,赵静.一种结合反馈信息的贝叶斯分类增量学习方法[J].计算机应用,2011,31(9):2530-2533. 被引量：5
8王世旭,吕干云.基于标签传播半监督学习的电压暂降源识别[J].电力系统及其自动化学报,2013,25(4):34-38. 被引量：8
9石立新,张俊星.基于势函数的标签传播社区发现算法[J].计算机应用,2014,34(3):738-741. 被引量：3
10王会娟,廖理.中国P2P网络借贷平台信用认证机制研究——来自“人人贷”的经验证据[J].中国工业经济,2014(4):136-147. 被引量：345

引证文献2

1刘翱,胡超,邓旭东,童泽平,任亮.基于标签传播的P2P网络借贷平台分类[J].计算机应用与软件,2018,35(6):292-297. 被引量：1
2刘凌云,钱辉,邢红杰,董春茹,张峰.一种基于Q-学习算法的增量分类模型[J].计算机科学,2020,47(8):171-177. 被引量：3

二级引证文献4

1夏常明.基于朴素贝叶斯算法的电网建设资源自动化分类模型研究[J].粘接,2021(12):93-97. 被引量：1
2张桃宁,梁雪春.基于宽深学习的P2P借款人违约风险预测[J].计算机应用与软件,2023,40(6):29-33.
3黄楠,李冬冬,姚佳,王喆.结合元学习的去中心化联邦增量学习方法[J].计算机科学,2024,51(3):271-279.
4石发太,孙卫军.基于多元增量分析模型的流域电厂大数据采集监视[J].计算技术与自动化,2024,43(1):72-77.

1丁沂.软件度量探析[J].软件导刊,2012,11(3):26-27. 被引量：1
2刘威,刘尚,周璇.BP神经网络子批量学习方法研究[J].智能系统学报,2016,11(2):226-232. 被引量：5
3林智勇.数据不平衡及其他对SVM分类器的影响—实验研究[J].广东技术师范学院学报,2008,29(6):15-19. 被引量：1
4王浩.基于随机森林的网络攻击检测方法[J].软件,2016,37(11):60-63. 被引量：4
5吴冬梅.小波基下的多分辨率SURE阈值信号估计[J].西安科技大学学报,2005,25(3):345-348. 被引量：3
6李勇.一种基于投票的不平衡数据分类集成算法[J].科学技术与工程,2014,22(21):275-279. 被引量：3
7李元菊.数据不平衡分类研究综述[J].现代计算机,2016,22(3):30-33. 被引量：6
8何苑,郝梦岩,谭红叶.基于最小风险贝叶斯的垃圾博客识别算法研究[J].山西大学学报（自然科学版）,2014,37(1):42-47. 被引量：1
9马胜祥,马建庆,杨明.基于核函数拟合的非平衡数据分类方法[J].计算机应用与软件,2010,27(4):177-179. 被引量：1
10张银川,白书奎.基于矩阵运算的单隐层Madaline网络批量学习[J].计算机应用,2012,32(12):3339-3342.

计算机应用与软件

2016年第8期

浏览历史

内容加载中请稍等...

改进的增量贝叶斯模型的研究被引量：2

参考文献1

二级参考文献1

共引文献54

同被引文献26

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

改进的增量贝叶斯模型的研究 被引量：2

参考文献1

二级参考文献1

共引文献54

同被引文献26

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

改进的增量贝叶斯模型的研究被引量：2