期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于样本噪声响应法的轮廓波消噪算法 被引量:1
1
作者 陈新武 田金文 沈绪榜 《系统工程与电子技术》 EI CSCD 北大核心 2008年第12期2302-2305,共4页
分析了轮廓波消噪的有关性质,提出了适用于轮廓波消噪确定子带阈值收敛因子的样本噪声响应法。该方法根据样本噪声(标准高斯白噪声或者特定冲激信号)作用在每个子带上的统计特性,得到每个子带的收敛因子,使用该收敛因子对3σ(或4σ)准... 分析了轮廓波消噪的有关性质,提出了适用于轮廓波消噪确定子带阈值收敛因子的样本噪声响应法。该方法根据样本噪声(标准高斯白噪声或者特定冲激信号)作用在每个子带上的统计特性,得到每个子带的收敛因子,使用该收敛因子对3σ(或4σ)准则进行修正来确定不同尺度不同方向子带的硬阈值门限。图像消噪实验结果表明:无论在峰值信噪比方面还是在视觉效果方面,本方法均可以取得比较满意的消噪效果;对于尺度较大的图像,可以极大地加快消噪速度并减小内存需求;硬阈值消噪之后使用自适应维纳滤波,峰值信噪比会有一定程度的提高。 展开更多
关键词 轮廓波变换 样本噪声图像 维纳滤波 峰值信噪比 通道收敛因子 高斯白噪声
下载PDF
基于噪声样本渐近修正的中医舌色分类方法
2
作者 孙亮亮 李艳萍 +1 位作者 张辉 卓力 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1450-1459,共10页
基于深度学习的中医舌色分类模型具备良好的性能,但是依赖大量正确标注的样本.由于人工标注样本费时费力,不可避免地存在错误标注,导致模型在训练过程中对噪声样本过拟合,使其泛化能力变差.为此,本文提出了一种基于噪声样本渐近修正的... 基于深度学习的中医舌色分类模型具备良好的性能,但是依赖大量正确标注的样本.由于人工标注样本费时费力,不可避免地存在错误标注,导致模型在训练过程中对噪声样本过拟合,使其泛化能力变差.为此,本文提出了一种基于噪声样本渐近修正的中医舌色分类方法.首先,根据舌色分类的特点,提出了一种全局-局部特征融合方法,将其嵌入到ResNet18骨干网络中,构建了舌色分类网络,并采用集成学习范式,提高分类模型的可靠性和稳定性;其次,针对噪声样本下的舌色分类网络训练问题,提出了样本注意力机制和噪声样本标签重新标注机制,在训练过程中对干净样本和噪声样本加以区分,赋予不同的权重,并逐步对噪声样本标签进行修正;最后,采用Boostrapping损失函数降低模型对噪声样本的关注度,抑制噪声样本对分类性能的影响.将提出的方法在两个自建的舌色分类数据集上进行了实验验证,结果表明,该方法通过渐进地对噪声标签进行校正,可以获得比现有的有噪样本下图像分类方法更高的分类精度,Acc指标分别达到了94.6%和93.65%. 展开更多
关键词 中医舌色分类 噪声样本 样本注意力机制 重新标注机制 Boostrapping损失
下载PDF
基于Hyperopt-LightGBM的直流配电网短期负荷抗噪声预测
3
作者 韩璟琳 冯喜春 +2 位作者 胡平 陈志永 李光毅 《高电压技术》 EI CAS CSCD 北大核心 2024年第11期4902-4911,I0007-I0009,共13页
为提升直流配电网中的短期负荷预测准确性与抗噪性,提出了一种基于超参数优化(hyperparameter op-timization,Hyperopt)-轻量型梯度提升机(light gradient machine,LightGBM)的短期负荷抗噪声预测模型。首先,以环形中压直流配电网为场景... 为提升直流配电网中的短期负荷预测准确性与抗噪性,提出了一种基于超参数优化(hyperparameter op-timization,Hyperopt)-轻量型梯度提升机(light gradient machine,LightGBM)的短期负荷抗噪声预测模型。首先,以环形中压直流配电网为场景,分析4种负荷的基本特征及其与历史数据(记为影响因素)的相关性,通过将相关性较强的影响因素作为输入,避免预测模型过拟合现象,从而提高负荷预测准确性及模型训练效率。然后,构建基于Hyperopt-LightGBM的中压直流配电网短期负荷预测模型,通过训练强学习器提高模型的抗噪性,进一步提高短期负荷预测准确性;通过Hyperopot提高模型自适应性,减轻人工调参负担。最后,基于直流配电网的4种负荷数据验证所提模型的有效性,不同预测模型下4种负荷的平均预测误差分别为:≤1.6%(所提模型),≤2.1%(极限梯度提升机模型),≤2%(随机森林模型)和≤4.1%(梯度提升决策树模型);不同噪声比下所提模型预测准确性>95%,且均高于传统模型。上述结果表明所提模型预测准确性更高、抗噪性及自适应性更好。 展开更多
关键词 中压直流配电网 短期负荷预测 样本噪声 超参数优化 轻量型梯度提升机
下载PDF
基于噪声样本的结构风险最小化原则
4
作者 杜二玲 崔玮 《电声技术》 2021年第9期73-75,80,共4页
统计学习理论中的结构风险最小化原则比经验风险最小化原则的实用性更强,对结构风险最小化原则的研究多是在样本不受噪声影响前提下进行的.基于此,给出零均值噪声样本的函数集容量的相关概念,并讨论了基于VC维的收敛速度的界,给出零均... 统计学习理论中的结构风险最小化原则比经验风险最小化原则的实用性更强,对结构风险最小化原则的研究多是在样本不受噪声影响前提下进行的.基于此,给出零均值噪声样本的函数集容量的相关概念,并讨论了基于VC维的收敛速度的界,给出零均值噪声样本的结构风险最小化原则,为进一步研究概率空间上噪声样本的学习理论提供了理论基础. 展开更多
关键词 零均值噪声样本 函数集容量 结构风险最小化原则
下载PDF
自动调整样本和特征权值的模糊聚类算法 被引量:6
5
作者 李凯 高岩 曹喆 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第9期1554-1560,共7页
针对模糊c均值聚类算法对特征噪声和样本噪声较敏感的缺陷,依据特征和样本对聚类的不同影响,将特征权值和样本权值引入到模糊c均值聚类的目标函数,并获得了一个模糊聚类模型。利用拉格朗日方法对该模型求解,提出了样本和特征权值自动调... 针对模糊c均值聚类算法对特征噪声和样本噪声较敏感的缺陷,依据特征和样本对聚类的不同影响,将特征权值和样本权值引入到模糊c均值聚类的目标函数,并获得了一个模糊聚类模型。利用拉格朗日方法对该模型求解,提出了样本和特征权值自动调整的模糊聚类算法;同时,将核策略引入到该模糊聚类模型,提出了样本和特征权值自动调整的核模糊聚类算法。实验结果表明该方法对含有特征噪声与样本噪声数据的聚类具有较好的处理能力,为特征提取与样本选取等问题提供了一种可行的途径。 展开更多
关键词 模糊聚类 目标函数 样本与特征加权 样本加权 特征加权 核方法 特征噪声 样本噪声
下载PDF
有噪声标注情况下的中医舌色分类方法 被引量:10
6
作者 卓力 孙亮亮 +2 位作者 张辉 李晓光 张菁 《电子与信息学报》 EI CSCD 北大核心 2022年第1期89-98,共10页
舌色是中医(TCM)望诊最关注的诊察特征之一,自动准确的舌色分类是舌诊客观化研究的重要内容。由于不同类别舌色之间的视觉界限存在模糊性以及医生标注者的主观性等,标注的舌象数据中常含有噪声,影响舌色分类模型的训练。为此,该文提出... 舌色是中医(TCM)望诊最关注的诊察特征之一,自动准确的舌色分类是舌诊客观化研究的重要内容。由于不同类别舌色之间的视觉界限存在模糊性以及医生标注者的主观性等,标注的舌象数据中常含有噪声,影响舌色分类模型的训练。为此,该文提出一种有噪声标注情况下的中医舌色分类方法:首先,提出一种两阶段的数据清洗方法,对含有噪声的标注样本进行识别,并进行清洗;其次,设计一种基于通道注意力机制的轻型卷积神经网络,通过增强特征的表达能力,实现舌色的准确分类;最后,提出一种带有噪声样本过滤机制的知识蒸馏策略,该策略中加入了由教师网络主导的噪声样本过滤机制,进一步剔除噪声样本,同时利用教师网络指导轻型卷积神经网络的训练,提升了分类性能。在自建的中医舌色分类数据集上的实验结果表明,该文提出的舌色分类方法能以较低的计算复杂度,显著提升分类的准确率,达到了93.88%。 展开更多
关键词 中医舌色分类 噪声标注样本 数据清洗 知识蒸馏 轻型卷积神经网络
下载PDF
噪声消除与SMO算法收敛性
7
作者 何建兵 何清 史忠植 《计算机工程与应用》 CSCD 北大核心 2006年第24期160-163,共4页
近年来,随着序列最小优化分类算法SMO等一系列快速算法的推出,支持向量机在自动文本分类研究领域取得了很大的成功。大多数文本分类问题是线性可分的,使用线性核函数的SMO算法能够取得非常好的分类效果。但是文本向量是一种非常稀疏的向... 近年来,随着序列最小优化分类算法SMO等一系列快速算法的推出,支持向量机在自动文本分类研究领域取得了很大的成功。大多数文本分类问题是线性可分的,使用线性核函数的SMO算法能够取得非常好的分类效果。但是文本向量是一种非常稀疏的向量,采用线性核函数的SMO算法对噪声样本非常敏感,容易产生发散的问题。文章分析证明了噪声如何影响SMO算法收敛性。为了解决训练样本中噪声样本影响SMO算法收敛的问题,设计了一个消除噪声样本的算法,取得了非常好的效果。 展开更多
关键词 文本分类 支持向量机 SMO算法 噪声样本
下载PDF
增强的两阶段测试样本稀疏表示方法
8
作者 马莉娜 《福建电脑》 2013年第7期104-107,共4页
TPTSSR方法是一种基于L2范数的稀疏表示方法,在人脸识别中获得了成功的应用。然而,当训练样本较少时,TPTSSR方法就不能够正确有效地给出测试样本的稀疏表示,致使识别性能急剧下降,并且该算法对最近邻数M的取值也比较敏感。为了提高算法... TPTSSR方法是一种基于L2范数的稀疏表示方法,在人脸识别中获得了成功的应用。然而,当训练样本较少时,TPTSSR方法就不能够正确有效地给出测试样本的稀疏表示,致使识别性能急剧下降,并且该算法对最近邻数M的取值也比较敏感。为了提高算法的识别性能和鲁棒性,本文通过增加噪声样本来解决训练本集不充分的问题。基于ORL、Yale、AR和FERET人脸库上的实验结果表明,所建议的策略提高了算法的识别性能和增强了其鲁棒性。 展开更多
关键词 TPTSSR 稀疏表示 噪声样本 人脸识别
下载PDF
基于偏最小二乘回归的鲁棒性特征选择与分类算法 被引量:9
9
作者 尚志刚 董永慧 +1 位作者 李蒙蒙 李志辉 《计算机应用》 CSCD 北大核心 2017年第3期871-875,共5页
提出一种基于偏最小二乘回归的鲁棒性特征选择与分类算法(RFSC-PLSR)用于解决特征选择中特征之间的冗余和多重共线性问题。首先,定义一个基于邻域估计的样本类一致性系数;然后,根据不同k近邻(k NN)操作筛选出局部类分布结构稳定的保守样... 提出一种基于偏最小二乘回归的鲁棒性特征选择与分类算法(RFSC-PLSR)用于解决特征选择中特征之间的冗余和多重共线性问题。首先,定义一个基于邻域估计的样本类一致性系数;然后,根据不同k近邻(k NN)操作筛选出局部类分布结构稳定的保守样本,用其建立偏最小二乘回归模型,进行鲁棒性特征选择;最后,在全局结构角度上,用类一致性系数和所有样本的优选特征子集建立偏最小二乘分类模型。从UCI数据库中选择了5个不同维度的数据集进行数值实验,实验结果表明,与支持向量机(SVM)、朴素贝叶斯(NB)、BP神经网络(BPNN)和Logistic回归(LR)四种典型的分类器相比,RFSC-PLSR在低维、中维、高维等不同情况下,分类准确率、鲁棒性和计算效率三种性能上均表现出较强的竞争力。 展开更多
关键词 偏最小二乘回归 K近邻 噪声样本 特征选择 鲁棒性
下载PDF
邻域感知的不平衡数据集过采样方法 被引量:6
10
作者 严远亭 戴涛 +2 位作者 张以文 赵姝 张燕平 《小型微型计算机系统》 CSCD 北大核心 2021年第7期1360-1370,共11页
不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效... 不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效的过采样,仍然是一个具有挑战的问题.本文提出一种有监督的样本空间分布学习方法,用以学习少数类样本的局部邻域信息,并以局部邻域信息约束过采样过程中样本的合成,以降低线性插值可能带来的噪声以及样本重叠等不利因素,从而提高过采样的效率.在典型不平衡数据集上的实验表明,利用少数类样本邻域信息为约束,能有效提升过采样的效率. 展开更多
关键词 不平衡学习 过采样 SMOTE 邻域信息 噪声样本
下载PDF
基于稀疏学习的kNN分类 被引量:8
11
作者 宗鸣 龚永红 +2 位作者 文国秋 程德波 朱永华 《广西师范大学学报(自然科学版)》 CAS 北大核心 2016年第3期39-45,共7页
在kNN算法分类问题中,k的取值一般是固定的,另外,训练样本中可能存在的噪声能影响分类结果。针对以上存在的两个问题,本文提出一种新的基于稀疏学习的kNN分类方法。本文用训练样本重构测试样本,其中,l_1-范数导致的稀疏性用来对每个测... 在kNN算法分类问题中,k的取值一般是固定的,另外,训练样本中可能存在的噪声能影响分类结果。针对以上存在的两个问题,本文提出一种新的基于稀疏学习的kNN分类方法。本文用训练样本重构测试样本,其中,l_1-范数导致的稀疏性用来对每个测试样本用不同数目的训练样本进行分类,这解决了kNN算法固定k值问题;l_(21)-范数产生的整行稀疏用来去除噪声样本。在UCI数据集上进行实验,本文使用的新算法比原来的kNN分类算法能取得更好的分类效果。 展开更多
关键词 稀疏学习 重构 l1-范数 l21-范数 噪声样本
下载PDF
流形上的k最近邻分类方法 被引量:3
12
作者 文志强 胡永祥 朱文球 《计算机应用》 CSCD 北大核心 2012年第12期3311-3314,3352,共5页
针对分类数据中存在噪声样本和维数问题,提出了流形上的k最近邻方法。首先,利用贝叶斯公式对经典k最近邻方法进行扩展,并采用核概率密度方法估计样本的局部联合概率密度;其次,建立噪声样本点对模型,并构建改进的边际本征图和相应的权值... 针对分类数据中存在噪声样本和维数问题,提出了流形上的k最近邻方法。首先,利用贝叶斯公式对经典k最近邻方法进行扩展,并采用核概率密度方法估计样本的局部联合概率密度;其次,建立噪声样本点对模型,并构建改进的边际本征图和相应的权值矩阵,通过定义目标函数寻找最优降维映射矩阵;最后,提出一个完整的流形上k最近邻算法。与6种经典方法在12个常用数据集上的实验比较表明,在大多数情况下所提方法的分类性能要优于其他方法。 展开更多
关键词 k最近邻 噪声样本 降维 分类器 流形
下载PDF
一种高效的K值自适应的SA-KNN算法 被引量:6
13
作者 孙可 龚永红 邓振云 《计算机工程与科学》 CSCD 北大核心 2015年第10期1965-1970,共6页
传统的K近邻(KNN)分类算法在实际应用过程中存在一些缺陷:没有考虑去除噪声样本,也没有考虑到在样本数据空间变换过程中保持样本数据本身的流形学结构,并且没有使用样本间属性的相关性。为此,提出引入稀疏学习理论,利用训练样本重构测... 传统的K近邻(KNN)分类算法在实际应用过程中存在一些缺陷:没有考虑去除噪声样本,也没有考虑到在样本数据空间变换过程中保持样本数据本身的流形学结构,并且没有使用样本间属性的相关性。为此,提出引入稀疏学习理论,利用训练样本重构测试样本的方法,重构过程使用了样本间的相关性,也用到局部保持投影LPP保持数据结构不变,同时引入l2,1范数用于去除噪声样本的方法来寻找投影变换矩阵W,进而利用W确定KNN算法中K值的SA-KNN算法。在UCI数据集上的仿真实验结果表明,该方法比传统的KNN分类算法和Entropy-KNN算法有更高的分类准确度。 展开更多
关键词 K近邻分类 相关性 去除噪声样本 局部保持投影 稀疏学习
下载PDF
基于遗传实例和特征选择的K近邻训练集优化方法 被引量:4
14
作者 董明刚 黄宇扬 敬超 《计算机科学》 CSCD 北大核心 2020年第8期178-184,共7页
K近邻的分类性能依赖于训练集的质量。设计高效的训练集优化算法具有重要意义。针对传统的进化训练集优化算法效率较低、误删率较高的不足,提出了一种遗传训练集优化算法。该算法采用基于最大汉明距离的高效遗传算法,每次交叉保留父代... K近邻的分类性能依赖于训练集的质量。设计高效的训练集优化算法具有重要意义。针对传统的进化训练集优化算法效率较低、误删率较高的不足,提出了一种遗传训练集优化算法。该算法采用基于最大汉明距离的高效遗传算法,每次交叉保留父代并生成两个新的具有最大汉明距离的子代,既提高了效率,又保证了种群多样性。该算法将局部的噪声样本删除策略与特征选择策略相结合。首先使用决策树算法确定噪声样本存在的范围,然后使用遗传算法精准删除此范围内的噪声样本和全局的噪声特征,降低了误删率,提高了效率。该算法采用基于最近邻规则的验证集选择策略,进一步提高了遗传算法实例选择和特征选择的准确度。在15个标准数据集上,该方法相较于协同进化实例特征选择算法IFS-CoCo、加权协同进化实例特征选择算法CIW-NN、进化特征选择算法EIS-RFS、进化实例选择算法PS-NN、K近邻算法KNN,在分类精度上分别平均提升了2.18%,2.06%,5.61%,4.06%和4.00%。实验结果表明,所提方法的分类精度和优化效率优于当前的进化训练集优化算法。 展开更多
关键词 遗传算法 K近邻 实例选择 特征选择 噪声样本 决策树
下载PDF
基于混合模重构的kNN回归 被引量:3
15
作者 龚永红 宗鸣 +1 位作者 朱永华 程德波 《计算机应用与软件》 CSCD 2016年第2期232-236,241,共6页
对于线性回归中k NN(k-Nearest Neighbor)算法的k值固定问题和训练样本中的噪声问题,提出一种新的基于重构的稀疏编码方法。该方法用训练样本重构每一个测试样本,重构过程中,l_1-范数被用来确保每个测试样本被不同数目的训练样本来预测... 对于线性回归中k NN(k-Nearest Neighbor)算法的k值固定问题和训练样本中的噪声问题,提出一种新的基于重构的稀疏编码方法。该方法用训练样本重构每一个测试样本,重构过程中,l_1-范数被用来确保每个测试样本被不同数目的训练样本来预测,以此解决kNN算法固定k值问题;l_(2,1)-范数导致的整行稀疏被用来去除噪声样本,以避免数据集上的噪声对重构产生不利影响。实验在UCI数据集上显示:新的改进算法比原来的kNN算法在线性回归中具有更好的预测效果。 展开更多
关键词 线性回归 稀疏编码 重构l1-范数l2 1-范数 噪声样本
下载PDF
基于特征频率分析的输油泵汽蚀故障初期噪声样本合成方法 被引量:2
16
作者 刘祥楼 常季成 +1 位作者 刘瑞男 刘昭廷 《自动化与仪器仪表》 2017年第12期162-164,共3页
针对输油泵故障在线实时监测过程中实现汽蚀故障初期状态的精准判别,需要依据具体机组汽蚀噪声特征确定汽蚀故障初期噪声比对分析样本。为此,提出基于特征频率分析的输油泵汽蚀故障初期噪声样本合成方法。本文依据在石油集输生产现场采... 针对输油泵故障在线实时监测过程中实现汽蚀故障初期状态的精准判别,需要依据具体机组汽蚀噪声特征确定汽蚀故障初期噪声比对分析样本。为此,提出基于特征频率分析的输油泵汽蚀故障初期噪声样本合成方法。本文依据在石油集输生产现场采集FS100-65-200机组运行噪声样本中捕捉汽蚀故障初期噪声频谱,按幅值递减方式从中提取前N个单频信号,以此为基准基于Lab VIEW实现汽蚀故障初期噪声样本合成。试验证明,合成频率给定值调整步长为1Hz,给定频率与基准频率最大偏差0.32Hz,对应合成信号与基准信号幅值占比相对误差最大值1.90%,该方法针对不同型号输油泵机组具有可重复性和现实可操作性。 展开更多
关键词 输油泵 汽蚀故障 特征频率分析 噪声样本合成
原文传递
HSMOTE-AdaBoost:改进混合边界重采样集成分类算法
17
作者 李静 刘姜 +1 位作者 倪枫 李笑语 《智能计算机与应用》 2023年第7期7-14,共8页
处理类不平衡问题时,已有的采样方法存在易受噪声影响和忽略边界样本的问题,尤其是忽略多数类样本的类内差异,位于边界的样本实例非常容易被错分,而这些样本对划分决策边界具有重要作用。将SMOTE过采样和RUS随机欠采样方法结合并进行改... 处理类不平衡问题时,已有的采样方法存在易受噪声影响和忽略边界样本的问题,尤其是忽略多数类样本的类内差异,位于边界的样本实例非常容易被错分,而这些样本对划分决策边界具有重要作用。将SMOTE过采样和RUS随机欠采样方法结合并进行改进,提出混合边界重采样算法(HSMOTE-AdaBoost)。HSMOTE-AdaBoost算法首先对少数类运用SMOTE过采样,提高数据的平衡度;再使用K近邻算法清除噪声和采样方法产生的重叠实例;同时,基于与少数类样本的平均欧氏距离识别并保留边界多数类样本,然后对剩余的数据进行随机欠采样;最后,利用AdaBoost算法的优势,对平衡后的数据集进行多次迭代训练得到最终的分类模型。仿真实验结果表明,与传统的SMOTE-Boost、RUS-Boost、PC-Boost及改进后的算法KSMOTE-AdaBoost相比,该分类模型在不平衡数据集上的所有性能指标F-measure,G-mean,AUC值分别最高提升了22.97%,13.88%和10.03%,具有更优的分类效果。 展开更多
关键词 类不平衡 SMOTE过采样 ADABOOST算法 噪声样本 边界样本
下载PDF
面向K最近邻分类的遗传实例选择算法 被引量:7
18
作者 黄宇扬 董明刚 敬超 《计算机应用》 CSCD 北大核心 2018年第11期3112-3118,共7页
针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的遗传实例选择算法。该算法采用基于决策树和遗传算法的二阶段筛选机制,先使用决策树确定噪声样本存在的范围;再使用遗传算法在该范围... 针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的遗传实例选择算法。该算法采用基于决策树和遗传算法的二阶段筛选机制,先使用决策树确定噪声样本存在的范围;再使用遗传算法在该范围内精确删除噪声样本,可有效地降低误删率并提高效率,采用基于最近邻规则的验证集选择策略,进一步提高了遗传算法实例选择的准确度;最后引进基于均方误差(MSE)的分类精度惩罚函数来计算遗传算法中个体的适应度,提高有效性和稳定性。在20个数据集上,该方法相较于基于预分类的KNN(PRKNN)、基于协同进化的实例特征选择算法(IFS-CoCo)、K最近邻(KNN),在分类精度上的提升分别为0.07~26.9个百分点、0.03~11.8个百分点、0.2~12.64个百分点,在AUC和Kappa的上的提升分别为0.25~18.32个百分点、1.27~23.29个百分点、0.04~12.82个百分点。实验结果表明,该方法相较于当前实例选择算法在分类精度和分类效率上均具有优势。 展开更多
关键词 K最近邻 遗传算法 决策树 实例选择 噪声样本 机器学习
下载PDF
基于改进Tri-Training算法的健康大数据分类模型研究 被引量:2
19
作者 唐校辉 廖欣 +1 位作者 陈雷霆 陈文昭 《现代计算机(中旬刊)》 2017年第7期21-25,共5页
Tri-Training是半监督协同训练的代表性算法之一,它运用统计技术标记置信度,并结合噪音学习理论进行无标记样本分类。当扩充样本训练集不满足噪音学习理论时,会进行随机采样,针对传统Tri-Training算法随机选取基础分类器的扩充训练样本... Tri-Training是半监督协同训练的代表性算法之一,它运用统计技术标记置信度,并结合噪音学习理论进行无标记样本分类。当扩充样本训练集不满足噪音学习理论时,会进行随机采样,针对传统Tri-Training算法随机选取基础分类器的扩充训练样本集会引入噪声这一缺陷,通过更改扩充样本训练集选取方式,剔除可能提高分类误差的样本。在健康大数据集上进行一系列验证试验,实验结果表明,改进的算法优于原始算法,降低分类错误率。 展开更多
关键词 Tri—Training 协同训练 分类误差 噪声样本
下载PDF
面向边缘设备的端到端人脸检测网络 被引量:1
20
作者 李莉 齐浩 耿华 《现代电子技术》 2021年第16期161-164,共4页
针对常用的人脸检测算法模型训练难、计算量大,导致算法难以部署到边缘端设备的问题,提出一种基于轻量化SSD的人脸检测算法。首先,在数据集中加入部分模糊和有遮挡的含噪声样本,以此来增强训练数据集;然后,引入深度可分离思想对SSD目标... 针对常用的人脸检测算法模型训练难、计算量大,导致算法难以部署到边缘端设备的问题,提出一种基于轻量化SSD的人脸检测算法。首先,在数据集中加入部分模糊和有遮挡的含噪声样本,以此来增强训练数据集;然后,引入深度可分离思想对SSD目标检测网络进行轻量化操作,通过增强数据对网络进行训练,获得用于人脸检测的轻量级神经网络;最后,将实验模型在FDDB和Yale-face数据集上进行实验,在FDDB数据集上正确检测率达到了97.03%,在Yale-face上的检测率则达到了87.42%。实验结果表明,所提算法在保持精度的同时具有较低的模型复杂度和计算量。 展开更多
关键词 人脸检测 边缘设备 噪声样本 特征增强 数据集训练 轻量化操作 SSD
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部