期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于样本不确定性和代表性相结合的可控主动学习算法研究 被引量:4
1
作者 胡正平 高文涛 万春艳 《燕山大学学报》 CAS 2009年第4期341-346,共6页
通过选取最有信息量的样本提交专家进行标注,主动学习算法可以有效地减少无效标注样本的工作量。在充分考虑位于分类边界的不确定样本和基于先验分布的具有代表性样本的基础上,本文构造了不确定性与代表性相结合的可控主动学习算法。首... 通过选取最有信息量的样本提交专家进行标注,主动学习算法可以有效地减少无效标注样本的工作量。在充分考虑位于分类边界的不确定样本和基于先验分布的具有代表性样本的基础上,本文构造了不确定性与代表性相结合的可控主动学习算法。首先利用样本的NN分布状况建立不确定性置信度模型,该思路不需要知道样本分布的具体类型和参数计算;然后在样本聚集度模型的基础上进行聚类,在此基础上建立代表性置信度模型。最后将不确定性置信度模型与代表性置信度模型进行综合,构造可控的主动学习策略,使得每次主动学习选择的样本更具有"价值"。在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,当达到相同的目标正确率时,本文的方法比随机采样算法所需的样本数量少得多。 展开更多
关键词 可控主动学习 不确定性样本 样本先验分布 代表性样本
下载PDF
样本不确定性对基于SPI干旱评估的影响 被引量:2
2
作者 张瑞涵 王义民 郭爱军 《西北农林科技大学学报(自然科学版)》 CSCD 北大核心 2019年第11期134-142,154,共10页
【目的】分析样本不确定性对干旱评估结果的影响,为防旱减灾工作中干旱的准确评估提供支持。【方法】分别采用参数Bootstrap与非参数Bootstrap抽样方法得到黄河上游(龙羊峡以上区域)1960-2013年共53年的系列标准化降水指数(SPI)值,并通... 【目的】分析样本不确定性对干旱评估结果的影响,为防旱减灾工作中干旱的准确评估提供支持。【方法】分别采用参数Bootstrap与非参数Bootstrap抽样方法得到黄河上游(龙羊峡以上区域)1960-2013年共53年的系列标准化降水指数(SPI)值,并通过方差和置信区间宽度2种不确定性量化指标,研究样本不确定性对SPI干旱评估结果的影响。【结果】样本不确定性对SPI评估结果影响显著,其大小随SPI值发生规律性变化,当SPI接近0值时,样本不确定性对SPI评估结果的影响较小;当SPI值减小或增大时,样本不确定性的影响均逐步增大,SPI评估结果的可靠性变差;在降水样本容量相同的条件下,一般基于参数Bootstrap重采样方法的SPI表现为较小的方差和较窄的置信区间宽度。【结论】在应用SPI评估区域干旱状况时,应充分考虑样本不确定性对评估结果的影响;为了减少SPI值的不确定性,宜采用基于非参数Bootstrap的重抽样方法,特别是针对极端事件;若降水样本存在异常值,宜采用基于参数Bootstrap的抽样方法。 展开更多
关键词 干旱评估 样本不确定性 标准化降水指数 Bootstrap重抽样法
下载PDF
考虑抽样不确定性的水文设计值估计 被引量:10
3
作者 胡义明 梁忠民 +1 位作者 王军 杨好周 《水科学进展》 EI CAS CSCD 北大核心 2013年第5期667-674,共8页
水文频率分析计算过程中,水文极值样本系列容量一般都较小、代表性不高,使得水文设计值估计具有不确定性。利用Bootstrap方法,研究样本抽样不确定性对水文设计值的影响。与传统水文频率分析方法相比,基于Bootstrap方法不仅可提供设计值... 水文频率分析计算过程中,水文极值样本系列容量一般都较小、代表性不高,使得水文设计值估计具有不确定性。利用Bootstrap方法,研究样本抽样不确定性对水文设计值的影响。与传统水文频率分析方法相比,基于Bootstrap方法不仅可提供设计值的点估计和区间估计,同时能够对设计值的不确定性进行定量评价。此外,基于Bootstrap技术,结合矩法、权函数法及线性矩法,设置3套方案,分析了该方法在不同参数估计方法间的有效性。以南通市1970—2011年共42年的年降雨量数据资料为例,对所提方法进行实例应用分析,结果表明,从期望设计值、90%置信区间及最终设计值角度而言,基于所提方法的设计成果受参数估计方法的选取影响不大,且可回避规范中B值诺莫图通用性较差及误差显著问题。 展开更多
关键词 水文频率分析 设计值 BOOTSTRAP 样本不确定性
下载PDF
基于样本不同属性综合的鲁棒偏倚赖主动学习分类算法研究
4
作者 任大伟 胡正平 高文涛 《燕山大学学报》 CAS 2011年第1期74-80,共7页
主动学习算法可以有效减少样本标注的工作量,每次选取最有信息量的样本交由专家标注。样本的代表性与不确定性都是衡量样本信息量的重要因素,将两者综合考虑能够获得更好的综合效果,但在两者的结合方式上一直存在不少问题,导致算法的适... 主动学习算法可以有效减少样本标注的工作量,每次选取最有信息量的样本交由专家标注。样本的代表性与不确定性都是衡量样本信息量的重要因素,将两者综合考虑能够获得更好的综合效果,但在两者的结合方式上一直存在不少问题,导致算法的适应性不强。为解决该问题,本文提出了基于样本不同属性的鲁棒偏倚赖主动学习分类算法,通过引入偏倚赖权值系数函数,在综合考虑样本的代表性和不确定性的同时,更可以突出样本的特性。同时由于样本代表性模型的渐变,在选择样本过程中更能突出代表性样本与不确定性样本的学习层次,前期训练以代表性样本为主,后期训练以不确定性样本为主,使得算法的适应性大大提高。在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,与所提供的对比算法相比,本文的方法只需较少的标注样本便可以达到相同的分类正确率。 展开更多
关键词 主动学习 偏倚赖 样本代表性 样本不确定性 分类
下载PDF
面向时间序列的鲁棒性半监督模糊C均值聚类 被引量:3
5
作者 徐久成 侯钦臣 +2 位作者 瞿康林 孙元豪 孟祥茹 《计算机工程与应用》 CSCD 北大核心 2023年第8期73-80,共8页
针对时间序列模糊C均值聚类算法对噪声数据敏感,及其未能将数据中少量已标记数据所包含的监督信息进行有效利用的问题,提出了一种改进的鲁棒性半监督模糊C均值聚类算法。该算法中先使用马氏距离提出一种样本不确定性分析方法,并加入到... 针对时间序列模糊C均值聚类算法对噪声数据敏感,及其未能将数据中少量已标记数据所包含的监督信息进行有效利用的问题,提出了一种改进的鲁棒性半监督模糊C均值聚类算法。该算法中先使用马氏距离提出一种样本不确定性分析方法,并加入到半监督模糊C均值聚类建模中,以消除噪声点的影响。并改进半监督模糊C均值聚类的部分监督机制来加大已标记数据的监督能力。采用能够弹性度量时间序列相似性的时间扭曲编辑距离代替欧氏距离进行聚类。通过对7组公开的时间序列数据集进行实验对比,结果表明所提算法具有良好的聚类效果。 展开更多
关键词 时间序列 半监督聚类 模糊C均值聚类 样本不确定性 时间扭曲编辑距离
下载PDF
基于a-BvSBEM主动学习的高光谱图像分类 被引量:5
6
作者 张琳 《国外电子测量技术》 2017年第4期17-20,共4页
在高光谱遥感图像分类中,需要大量的训练样本对分类器进行训练,然而对样本标记非常困难并且耗时、昂贵。针对样本标记困难的问题,提出了自适应的样本不确定性与代表性相结合的主动学习选择训练样本。样本的不确定性是利用最优标号与次... 在高光谱遥感图像分类中,需要大量的训练样本对分类器进行训练,然而对样本标记非常困难并且耗时、昂贵。针对样本标记困难的问题,提出了自适应的样本不确定性与代表性相结合的主动学习选择训练样本。样本的不确定性是利用最优标号与次优标号(best vs second-best,BvSB)的方法计算。用期望最大(expectation maximization,EM)聚类计算样本的代表性。然后将样本的不确定性与代表性通过自适应权重相结合,从而选出含信息量最大的未标注样本加入进行人工标注,并加入到训练样本。通过实验表明,此方法性能更加稳定,准确率也有一定的提高。 展开更多
关键词 主动学习 样本不确定性与代表性 期望最大聚类 自适应 高光谱图像分类
下载PDF
基于主动学习的图像分类协同训练模型研究 被引量:3
7
作者 柳永春 李娟 《赤峰学院学报(自然科学版)》 2021年第11期3-6,共4页
在当前数量庞大的网络存储图像中,如何在过滤不相关信息的同时挖掘出具有价值的信息参量,已成为图像处理技术的主要研究内容之一。对此,提出一种基于主动学习的图像分类协同训练模型。定义图像样本的不确定性水平,通过计算边缘抽样系数... 在当前数量庞大的网络存储图像中,如何在过滤不相关信息的同时挖掘出具有价值的信息参量,已成为图像处理技术的主要研究内容之一。对此,提出一种基于主动学习的图像分类协同训练模型。定义图像样本的不确定性水平,通过计算边缘抽样系数指标的方式,建立主动型分类核函数定义项,实现基于主动学习的图像分类处理。在此基础上,提供稳定的参数服务器配置环境,按照协同加速比的数值需求,确定收敛训练指标的具体计算数值,完成基于主动学习的图像分类协同训练模型研究。在面对等量存储图像数据时,协同训练模型比传统向量机模型的信息过滤速度更快,所挖掘出信息参量的价值潜力更大,可较好解决基于图像处理技术的实用性问题。 展开更多
关键词 主动学习 图像分类 协同训练 样本不确定性 抽样系数 核函数 参数服务器 加速比
下载PDF
Revised regional importance measures in the presence of epistemic and aleatory uncertainties
8
作者 CHENG Lei LU ZhenZhou WU DanQing 《Science China(Physics,Mechanics & Astronomy)》 SCIE EI CAS CSCD 2015年第1期84-94,共11页
Two revised regional importance measures(RIMs),that is,revised contribution to variance of sample mean(RCVSM)and revised contribution to variance of sample variance(RCVSV),are defined herein by using the revised means... Two revised regional importance measures(RIMs),that is,revised contribution to variance of sample mean(RCVSM)and revised contribution to variance of sample variance(RCVSV),are defined herein by using the revised means of sample mean and sample variance,which vary with the reduced range of the epistemic parameter.The RCVSM and RCVSV can be computed by the same set of samples,thus no extra computational cost is introduced with respect to the computations of CVSM and CVSV.From the plots of RCVSM and RCVSV,accurate quantitative information on variance reductions of sample mean and sample variance can be read because of reduced upper bound of the range of the epistemic parameter.For general form of quadratic polynomial output,the analytical solutions of the original and the revised RIMs are given.Numerical example is employed and results demonstrate that the analytical results are consistent and accurate.An engineering example is applied to testify the validity and rationality of the revised RIMs,which can give instructions to the engineers about how to reduce variance of sample mean and sample variance by reducing the range of epistemic parameters. 展开更多
关键词 revised rims sample mean sample variance variance reduction analytical solution
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部