增量式贝叶斯分类的原理和算法被引量：7

Principle and algorithm of incremental Bayes classification

下载PDF

导出

摘要自动分类是数据挖掘和机器学习中非常重要的研究领域.针对难以获得大量有类标签的训练集问题,提出了基于小规模训练集的增量式贝叶斯分类,给出增量式贝叶斯分类机理参数计算及其算法.对算法分两种情况处理:第一种情况是新增样本有类别标签,则利用现有分类器检验其类标签,如果匹配则保留当前分类器,否则利用新样本修正分类器;第二种情况是新增样本无类别标签,则利用现有分类器为其训练类标签,然后利用新样本来修正分类器.实验结果表明,该算法是可行有效的,比简单贝叶斯分类算法有更高的精度.增量式贝叶斯分类算法的提出为分类器的更新提供了一条新途径. Automatic classification is an important research field in data mining and machine learning. An incremental Bayes classification principle, parameter calculation and algorithm based on small training set was presented to solve the difficult problem involving getting labeled training documents. Two cases can be processed by the algorithm： the labled and unlabeled incremental documents. The labeled documents are labeled using the original classification, and if match then remain the classifier, the new classification is trained from the incremental documents. The unlabeled documents are labeled using the original classification, and then the new classification is trained from the incremental documents. The experimental results show that this algorithm is feasible and effective, more accurate than Nave Bayes classification algorithm. The incremental Bayes classification algorithm provides a new method for updating of classification.

作者李晓毅徐兆棣

机构地区沈阳师范大学数学与系统科学学院

出处《沈阳工业大学学报》 EI CAS 2006年第4期422-425,433,共5页 Journal of Shenyang University of Technology

基金国家自然科学基金资助项目(10471096)

关键词增量学习贝叶斯分类类别标签分类算法贝叶斯网络 incremental learning Bayes classification classification label classification algorithm Nave Bayes

分类号 O212.8 [理学—概率论与数理统计]

引文网络
相关文献

参考文献8

1Marco R,Paola S.Bayesian methods for intelligent data analysis[M].New york:Springer Press,1999.
2慕春棣,tsinghua.edu.cn,戴剑彬,叶俊.用于数据挖掘的贝叶斯网络[J].软件学报,2000,11(5):660-666. 被引量：100
3罗宁,穆志纯.基于贝叶斯网的分类器及其在CRM中的应用[J].计算机应用,2004,24(3):79-81. 被引量：6
4宫秀军,刘少辉,史忠植.一种增量贝叶斯分类模型[J].计算机学报,2002,25(6):645-650. 被引量：55
5林士敏,田凤占,陆玉昌.贝叶斯网络的建造及其在数据采掘中的应用[J].清华大学学报（自然科学版）,2001,41(1):49-52. 被引量：66
6Langley P,Sage S.Induction of selective Bayesian classifiers[A].Proc 10th Conference on Uncertainty in Artificial Intelli2 Gence Seattle[C].WA:Morgan Kaufmann,1994.
7Dominigos P,Pazzani M.On the optimality of the simple Bayesian classifier under zero-one loss[J].Machine Leaming,1997,29 (2-3):103-130.
8Nigam K,Mccallum A,Thrun S.Learning to classify the text from labeled and unlabeled documents[A].Proc 15th National Conference on Artificial Intelligence[C].WA:Wisconsin,1998.

二级参考文献22

1宫秀军史忠植.基于贝叶斯潜在语义模型的半监督Web挖掘[J].软件学报，已录用,.
21.Chickering D. Learning equivalence classes of Bayesian networks structures. In: Horvitz E, Jensen F ed. Proceedings of the 12th Conference on Uncertainty in Artificial Intelligence. San Francisco, CA: Morgan Kaufmann Publishers, Inc., 1996. 54～61
32.Geriger D, Hekerman D. A charactererization of the Dirichlet distribution with application to learning Bayesian networks. In: Besnard P, Hanks S eds. Proceedings of the 11th Conference on Uncertainty in Artificial Intelligence. Morgan Kaufmann Publishers Inc., 1995. 196～207
43.Heckman D. A Bayesian approach for learning causal networks. In: Besnard P, Hanks S eds. Proceedings of the 11th Conference on Uncertainty in Artificial Intelligence. San Francisco, CA: Morgan Kaufmann Publishers, Inc., 1995. 285～295
54.Heckman D, Geiger D, Chickering D. Learning Bayesian networks: the combination of knowledge and statistical data. Machine Learning, 1995,20(3):197～243
65.Heckman D, Shachter R. Decision-Theoretic foundations for causal reasoning. Journal of Artificial Intelligence Research, 1995,3:405～430
76.Heckman D, Mandani A, Wellman M. Real-World applications of Bayesian networks. Communications of the ACM, 1995,38(3):38～45
87.Buntine W. Theory refinement on Bayesian networks. In: Proceedings of the 7th Conference on Uncertainty in Artificial Intelligence. Los Angeles, CA: Morgan Kaufmann Publishers, Inc., 1991. 52～61
98.Cooper G, Herskovits E. A Bayesian method for the introduction of probabilistic networks from data. Machine Learning, 1992,9(4):309～347
109.Russell S, Binder J, Koller D et al. Local learning in probabilistic networks with hidden variables. In: Cooper G F, Moral S ed. Proceedings of the 14th International Joint Conference on Artificial Intelligence. San Francisco, CA: Morgan Kaufmann Publishers, Inc., 1998. 1146～1152

共引文献213

1石康乐,孟庆刚.基于贝叶斯推理的中医诊疗小数据构建设想[J].中华中医药学刊,2022,40(5):104-107. 被引量：3
2盛春阳,张元.基于贝叶斯网络模型的交通状态预测[J].山东交通科技,2007(4):4-6. 被引量：3
3盛春阳,张元.基于贝叶斯网络模型的交通状态预测[J].西部交通科技,2007(6):111-114. 被引量：1
4杨欣斌,孙京诰,黄道.基于Bayesian网络的缺损数据处理方法[J].华东理工大学学报（社会科学版）,2002,17(S1):41-44. 被引量：3
5陈秀琼.基于贝叶斯网络的数据挖掘技术[J].三明高等专科学校学报,2004,21(2):47-52. 被引量：3
6姜卯生,王浩,姚宏亮.朴素贝叶斯分类器增量学习序列算法研究[J].计算机工程与应用,2004,40(14):57-59. 被引量：10
7张少中,王秀坤,孙莹光.贝叶斯网络及其在决策支持系统中的应用[J].计算机工程,2004,30(10):1-3. 被引量：14
8胡彩平,倪志伟,李龙澍,贾瑞玉.基于贝叶斯方法的范例检索[J].计算机工程,2004,30(15):58-59. 被引量：1
9王世卿,马大为.基于贝叶斯网络的实时行情预测算法[J].郑州大学学报（理学版）,2004,36(3):9-12.
10余东峰,孙兆林.基于贝叶斯网络不确定推理的研究[J].微型电脑应用,2004,20(8):6-8. 被引量：23

同被引文献55

1肖明,殷锋,张楠.垃圾邮件过滤技术及发展[J].西南民族大学学报（自然科学版）,2007,33(1):207-212. 被引量：8
2刘伟辉,王丽珍.基于多关系的空间分类算法研究[J].云南大学学报（自然科学版）,2006,28(S1):158-163. 被引量：4
3徐燕,李锦涛,王斌,孙春明,张森.不均衡数据集上文本分类的特征选择研究[J].计算机研究与发展,2007,44(z2):58-62. 被引量：20
4赵红,李雅菊,宋涛.基于贝叶斯网络的工程项目风险管理[J].沈阳工业大学学报（社会科学版）,2008,1(3):239-244. 被引量：25
5程泽凯,林士敏,陆玉昌,蒋望东,陆小艺.基于Matlab的贝叶斯分类器实验平台MBNC[J].复旦学报（自然科学版）,2004,43(5):729-732. 被引量：27
6肖旻,刘晓璐,屠立忠.基于贝叶斯分类的邮件过滤方法及模型研究[J].南京师范大学学报（工程技术版）,2006,6(2):86-89. 被引量：6
7何慧,苏一丹,周叶.基于增量式贝叶斯智能入侵检测模型[J].江西师范大学学报（自然科学版）,2007,31(1):70-72. 被引量：2
8蒋志方,祝翠玲,吴强.一个对不带类别标记文本进行分类的方法[J].计算机工程,2007,33(12):96-98. 被引量：1
9程卫华,尤晋元.基于内容过滤的反垃圾邮件系统的设计与实现[J].安徽大学学报（自然科学版）,2007,31(3):30-33. 被引量：13
10Friedman N, Geiger D. Bayesian Network Classifier[J]. Machine Learning, 1997, 29(2/3): 131-163.

引证文献7

1蒋望东,陆小艺,林士敏.处理缺失数据的朴素贝叶斯分类增量算法[J].科学技术与工程,2008,8(14):3812-3815. 被引量：2
2丁厉华,张小刚.一种基于类支持度的增量贝叶斯学习算法[J].计算机工程,2008,34(22):218-219. 被引量：4
3余承依.基于贝叶斯增量分类的邮件过滤研究[J].科学技术与工程,2009,9(9):2356-2361. 被引量：1
4段勇,崔宝侠,徐心和.多智能体强化学习及其在足球机器人角色分配中的应用[J].控制理论与应用,2009,26(4):371-376. 被引量：26
5李金华,梁永全,吕芳芳.一种加权朴素贝叶斯分类增量学习模型[J].计算机与现代化,2010(5):30-32. 被引量：1
6李晓毅,徐兆棣.一种增量式贝叶斯分类的算法[J].沈阳农业大学学报,2011,42(3):349-353. 被引量：1
7卢玲,杨武,唐继强.伪相关反馈的文本情感分类方法[J].计算机仿真,2013,30(11):268-271. 被引量：1

二级引证文献35

1邓本再,张中景,王江银.基于最优化模糊逻辑的Robocup中型组动态角色分配[J].计算技术与自动化,2011,30(1):50-53. 被引量：1
2常晓军.基于联合强化学习的RoboCup-2D传球策略[J].计算机工程与应用,2011,47(23):212-216.
3吴军,徐昕,王健,贺汉根.面向多机器人系统的增强学习研究进展综述[J].控制与决策,2011,26(11):1601-1610. 被引量：22
4秦童.基于CMAC的Q算法在机器人足球中的应用[J].电子测试,2012,23(4):76-80.
5王东,熊世桓.一种基于特征置换的朴素贝叶斯分类器[J].兰州理工大学学报,2012,38(4):93-97. 被引量：1
6宋勇,李贻斌,李彩虹.移动机器人路径规划强化学习的初始化[J].控制理论与应用,2012,29(12):1623-1628. 被引量：26
7娄云峰,陈斌.基于态势评估的足球机器人决策模型[J].计算机技术与发展,2013,23(9):99-102. 被引量：1
8卢玲,杨武,唐继强.伪相关反馈的文本情感分类方法[J].计算机仿真,2013,30(11):268-271. 被引量：1
9余涛,张水平.基于5要素试错更新算法SARSA(λ)的自动发电控制[J].控制理论与应用,2013,30(10):1246-1251. 被引量：2
10姜玉莲,刘建昌,谭树彬,王申全.多机器人系统的鲁棒一致性算法[J].东北大学学报（自然科学版）,2014,35(8):1065-1068.

1李国志,王洪春,聂勇,李世全.基于因果图的贝叶斯网络[J].江西师范大学学报（自然科学版）,2009,33(5):608-612.
2周德全,刘国岁,吴黎光,苏卫民.连续特征空间离散化及类条件概率分布估计[J].信号处理,1998,14(A12):114-117. 被引量：2
3王利民,李雄飞,徐沛娟.面向多层次知识表达的贝叶斯分类模型研究[J].计算机科学,2009,36(3):119-122.
4陈勤,张国煊,王小华.文本自动模糊分类方法的研究[J].杭州电子科技大学学报（自然科学版）,1999,24(4):18-23.
5王红蔚,席红旗,孔波.一种新的半监督支持向量机[J].郑州大学学报（理学版）,2012,44(3):66-68. 被引量：6
6蔡珍凡.一种改进的快速支持向量机算法[J].科学技术与工程,2010,10(13):3031-3035. 被引量：2
7张琼.基于贝叶斯方法的高考成绩类别预测[J].太原师范学院学报（自然科学版）,2009,8(2):41-43. 被引量：2
8陈益军.一个基于贝叶斯方法的冬态树木分类系统的设计与实现[J].计算机应用与软件,2009,26(5):178-180. 被引量：1
9李春雨,盛昭瀚.神经网络对新增样本的学习算法[J].系统工程学报,1996,11(4):17-26. 被引量：1
10王凌云.熵理论和贝叶斯分类预测模型在升学计划影响因素分析中的应用[J].山东师范大学学报（自然科学版）,2010,25(2):29-31.

沈阳工业大学学报

2006年第4期

浏览历史

内容加载中请稍等...

增量式贝叶斯分类的原理和算法被引量：7

参考文献8

二级参考文献22

共引文献213

同被引文献55

引证文献7

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

增量式贝叶斯分类的原理和算法 被引量：7

参考文献8

二级参考文献22

共引文献213

同被引文献55

引证文献7

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

增量式贝叶斯分类的原理和算法被引量：7