期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于偏差–方差权衡的贝叶斯分类学习框架 被引量:1
1
作者 张文钧 蒋良孝 +1 位作者 张欢 胡成玉 《中国科学:信息科学》 CSCD 北大核心 2023年第6期1078-1095,共18页
朴素贝叶斯由于其简单、高效和有效性成为十大数据挖掘算法之一.然而它要求的属性条件独立假设在实际应用中很难成立.为了削弱其属性条件独立假设,学者们提出了结构扩展、属性选择、属性加权、实例选择、实例加权5类改进方法.现有改进... 朴素贝叶斯由于其简单、高效和有效性成为十大数据挖掘算法之一.然而它要求的属性条件独立假设在实际应用中很难成立.为了削弱其属性条件独立假设,学者们提出了结构扩展、属性选择、属性加权、实例选择、实例加权5类改进方法.现有改进方法虽然在一定程度上降低了模型的偏差,但同时也提高了模型的方差,因而限制了模型的泛化性能.偏差–方差权衡是机器学习的核心原则之一,该原则要求模型具有较低偏差的同时,方差也要尽量低.如何在贝叶斯分类学习中引入偏差–方差权衡,同时获得较低的偏差和方差,从而进一步提升模型的泛化性能,是本文关注的重点.为此,本文首先理论分析了在贝叶斯分类学习中做偏差–方差权衡的可行性,探讨了保证可行性的关键因素;然后通过构建回归任务来学习贝叶斯分类模型的后验概率损失,调控关键因素的变化;最后提出了一种基于偏差–方差权衡的贝叶斯分类学习框架,并在提出的学习框架下重新实现了朴素贝叶斯及其各类改进模型.在大量经典的UCI标准数据集上的实验结果表明,现有的各类先进的贝叶斯分类模型在本文所提学习框架下的分类性能显著优于其原始性能. 展开更多
关键词 朴素贝叶斯 属性条件独立假设 偏差方差权衡 后验概率损失 学习框架
原文传递
基于bagging思想的决策树分类算法研究 被引量:4
2
作者 赵宁杰 李雪飞 《北京服装学院学报(自然科学版)》 CAS 北大核心 2020年第3期43-48,共6页
分类算法在数据挖掘中是一种重要的研究方法,目前多数决策树分类算法在对数据处理过程中或多或少存在一些问题,要么判断结束分类的条件过多,要么剪枝过程较为复杂,导致消耗时间较长,有时还无法得到令人满意的分类结果,往往需要通过调整... 分类算法在数据挖掘中是一种重要的研究方法,目前多数决策树分类算法在对数据处理过程中或多或少存在一些问题,要么判断结束分类的条件过多,要么剪枝过程较为复杂,导致消耗时间较长,有时还无法得到令人满意的分类结果,往往需要通过调整过多的参数等方式来完善分类模型,不断对算法进行优化。本文通过对几种经典算法进行研究,设计了一种基于bagging思想的决策树分类算法,并通过Java语言实现该算法;通过测试5个来自UCI的数据集,对其分类结果与经典算法进行了对比,该算法分类准确率较高,消耗时长较短,在实际应用中效果较好,且适用于大多数的样本集。 展开更多
关键词 数据挖掘 分类算法 BAGGING 方差偏差权衡 决策树
下载PDF
基于特征增广的生成–判别混合模型构建方法 被引量:1
3
作者 张文钧 蒋良孝 张欢 《中国科学:信息科学》 CSCD 北大核心 2022年第10期1792-1807,共16页
从概率框架的角度来看,生成模型首先由数据学习联合概率分布,然后再求出条件概率分布,通常具有更快的收敛速度;而判别模型由数据直接学习条件概率分布,往往具有更高的准确率.生成–判别混合模型作为二者的有效结合,同时集成了它们的优点... 从概率框架的角度来看,生成模型首先由数据学习联合概率分布,然后再求出条件概率分布,通常具有更快的收敛速度;而判别模型由数据直接学习条件概率分布,往往具有更高的准确率.生成–判别混合模型作为二者的有效结合,同时集成了它们的优点.然而,现有方法在构建混合模型时,需要将原始特征划分为两个独立的特征空间,分别用于训练生成模型和判别模型.特征划分不仅提升了模型的时间复杂度,还削弱了原始特征空间的表达能力.为了解决这一问题,本文提出了一种基于特征增广的生成–判别混合模型构建方法.该方法首先利用生成模型学习条件概率分布,然后将学到的条件概率分布作为新特征增广到原始特征空间中,最后在增广后的特征空间中训练判别模型并预测最终的分类结果.该方法利用特征增广的思想做模型混合,无需对原始特征进行划分,具有较低的时间复杂度,同时还增强了原始特征空间的表达能力.在36个经典UCI标准数据集上的实验结果表明,所提方法不仅具有有效性和通用性,还遵循了偏差–方差权衡原则. 展开更多
关键词 生成模型 判别模型 特征增广 条件概率分布 偏差方差权衡
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部