期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于数据剪辑的自训练信用评估集成分类模型
1
作者 刘文杰 王国强 《上海工程技术大学学报》 CAS 2024年第1期83-89,共7页
针对信用数据不平衡及类标签数据难以获取的问题,提出一种基于数据剪辑的自训练信用评估集成分类模型。首先,采用合成少数类过采样法(SMOTE)在有标记样本上采样,以缓解数据不平衡性。其次,在少量带标签样本数据集上构建Stacking集成模型... 针对信用数据不平衡及类标签数据难以获取的问题,提出一种基于数据剪辑的自训练信用评估集成分类模型。首先,采用合成少数类过采样法(SMOTE)在有标记样本上采样,以缓解数据不平衡性。其次,在少量带标签样本数据集上构建Stacking集成模型,并对无标记样本做“伪标记”,以获取类标签数据。最后,提出一种改进的双重加权半监督K近邻算法,并利用其剪辑伪标签数据和扩充训练集,直到模型收敛。使用UCI和Kaggle信用评估数据集进行仿真试验,结果表明,该模型具有更好的预测性能,更能有效识别少数类样本。 展开更多
关键词 信用评估 半监督学习 Stacking集成策略 数据剪辑 自训练
下载PDF
基于Tri-Training和数据剪辑的半监督聚类算法 被引量:30
2
作者 邓超 郭茂祖 《软件学报》 EI CSCD 北大核心 2008年第3期663-673,共11页
提出一种半监督聚类算法,该算法在用seeds集初始化聚类中心前,利用半监督分类方法Tri-training的迭代训练过程对无标记数据进行标记,并加入seeds集以扩大规模;同时,在Tri-training训练过程中结合基于最近邻规则的Depuration数据剪辑技术... 提出一种半监督聚类算法,该算法在用seeds集初始化聚类中心前,利用半监督分类方法Tri-training的迭代训练过程对无标记数据进行标记,并加入seeds集以扩大规模;同时,在Tri-training训练过程中结合基于最近邻规则的Depuration数据剪辑技术对seeds集扩大过程中产生的误标记噪声数据进行修正、净化,以提高seeds集质量.实验结果表明,所提出的基于Tri-training和数据剪辑的DE-Tri-training半监督聚类新算法能够有效改善seeds集对聚类中心的初始化效果,提高聚类性能. 展开更多
关键词 半监督聚类 半监督分类 K-均值 seeds集 TRI-TRAINING Depuration数据剪辑
下载PDF
基于自适应数据剪辑策略的Tri-training算法 被引量:14
3
作者 邓超 郭茂祖 《计算机学报》 EI CSCD 北大核心 2007年第8期1213-1226,共14页
Tri-training能有效利用无标记样例提高泛化能力.针对Tri-training迭代中无标记样例常被错误标记而形成训练集噪声,导致性能不稳定的缺点,文中提出ADE-Tri-training(Tri-training with Adaptive Data Editing)新算法.它不仅利用Remove O... Tri-training能有效利用无标记样例提高泛化能力.针对Tri-training迭代中无标记样例常被错误标记而形成训练集噪声,导致性能不稳定的缺点,文中提出ADE-Tri-training(Tri-training with Adaptive Data Editing)新算法.它不仅利用Remove Only剪辑操作对每次迭代可能产生的误标记样例识别并移除,更重要的是采用自适应策略来确定Remove Only触发与抑制的恰当时机.文中证明,PAC理论下自适应策略中一系列判别充分条件可同时确保新训练集规模迭代增大和新假设分类错误率迭代降低更多.UCI数据集上实验结果表明:ADE-Tri-training具有更好的分类泛化性能和健壮性. 展开更多
关键词 半监督学习 数据剪辑 自适应策略 PAC可学习 TRI-TRAINING
下载PDF
WilsonTh数据剪辑在邻域粗糙协同分类中的应用 被引量:2
4
作者 张维 苗夺谦 李峰 《计算机科学与探索》 CSCD 2014年第9期1092-1100,共9页
邻域粗糙协同分类模型结合了邻域粗糙集和协同学习理论,可以处理连续型数据,并可有效利用无标记数据提高分类的性能。但在学习过程中,无标记数据常被错误地标记,从而给训练集引入噪声数据,并导致分类性能不稳定。针对该问题,探讨了Wilso... 邻域粗糙协同分类模型结合了邻域粗糙集和协同学习理论,可以处理连续型数据,并可有效利用无标记数据提高分类的性能。但在学习过程中,无标记数据常被错误地标记,从而给训练集引入噪声数据,并导致分类性能不稳定。针对该问题,探讨了WilsonTh数据剪辑在邻域粗糙协同分类模型中的应用。在每一次迭代学习过程中,分类器给无标记数据加上类别标记后,应用WilsonTh数据剪辑选出最大可能标记正确的样本加入训练集,分类器在扩大的训练集上再训练以获得更好的性能。UCI数据集上实验结果表明,WilsonTh数据剪辑能有效地提高加入训练集的数据质量,从而增强邻域粗糙协同分类的性能。 展开更多
关键词 WilsonTh数据剪辑 邻域粗糙集 邻域互信息 协同学习 连续型数据
下载PDF
结合半监督聚类和数据剪辑的自训练方法 被引量:6
5
作者 吕佳 黎隽男 《计算机应用》 CSCD 北大核心 2018年第1期110-115,共6页
针对自训练方法在迭代中选出的置信度高的无标记样本所含信息量不大和自训练方法容易误标记无标记样本的问题,提出了一种结合半监督聚类和数据剪辑的Naive Bayes自训练方法。该自训练方法在每次迭代的时候,首先利用少量的有标记样本和... 针对自训练方法在迭代中选出的置信度高的无标记样本所含信息量不大和自训练方法容易误标记无标记样本的问题,提出了一种结合半监督聚类和数据剪辑的Naive Bayes自训练方法。该自训练方法在每次迭代的时候,首先利用少量的有标记样本和大量的无标记样本进行半监督聚类,从而选出聚类隶属度高的无标记样本作Naive Bayes分类;然后利用数据剪辑技术来过滤掉聚类隶属度高而被Naive Bayes误分类的无标记样本。该数据剪辑技术能够同时利用有标记样本和无标记样本信息进行噪声过滤,解决了传统数据剪辑技术的性能可能因有标记样本数量匮乏而下降的问题。通过在UCI数据集上的对比实验,证明了所提算法的有效性。 展开更多
关键词 自训练 半监督学习 半监督聚类 数据剪辑 最近邻
下载PDF
M+B型三值光学加法器的数据剪辑技术
6
作者 沈云付 张凯凯 蒋本朋 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第4期440-448,共9页
在电子计算机中,由于进位的存在使得多位数的加法效率并没有显著地提升,而光学方法则显示了其并行性和无进位的优势.在M+B型加法的运算法则和C、P、R 3个三值变换工作的基础上,对相关的数据剪辑技术进行了研究(M表示MSD数,B表示二进制... 在电子计算机中,由于进位的存在使得多位数的加法效率并没有显著地提升,而光学方法则显示了其并行性和无进位的优势.在M+B型加法的运算法则和C、P、R 3个三值变换工作的基础上,对相关的数据剪辑技术进行了研究(M表示MSD数,B表示二进制数).提出了M+B型加法的数据剪辑技术策略,并用软件模拟了3个三值变换以及数据的截断和拼接,验证了该方法的正确性和可实现性. 展开更多
关键词 三值光学计算机 MSD 加法器 数据剪辑 累加器
下载PDF
基于改进随机森林算法的电力业务实时流量分类方法 被引量:11
7
作者 许勇刚 张建业 +3 位作者 龚小刚 姜珂 周欢 殷继英 《电力系统保护与控制》 EI CSCD 北大核心 2016年第24期82-89,共8页
为了更有效地对电力业务系统安全接入过程中日渐增多的流量进行实时分类,提高电力系统的业务处理速度,提出了一种基于改进随机森林算法的电力业务实时流量分类方法。在分析电力业务安全接入实时流量特征的基础上,改进传统随机森林算法,... 为了更有效地对电力业务系统安全接入过程中日渐增多的流量进行实时分类,提高电力系统的业务处理速度,提出了一种基于改进随机森林算法的电力业务实时流量分类方法。在分析电力业务安全接入实时流量特征的基础上,改进传统随机森林算法,基于分类间隔加权对随机森林进行修剪来提高分类实时性;对新的样本数据进行数据剪辑来提高分类的准确性。在此改进算法的基础上设计了电力业务安全接入实时流量分类流程。最后以某省电力公司安全接入实时流量分类为例,验证了所提方法的准确性和实时性。 展开更多
关键词 随机森林 数据剪辑 分类间隔 电力业务 流量分类
下载PDF
高光谱遥感图像DE-self-training半监督分类算法 被引量:8
8
作者 王俊淑 江南 +3 位作者 张国明 胡斌 李杨 吕恒 《农业机械学报》 EI CAS CSCD 北大核心 2015年第5期239-244,共6页
提出了一种高光谱遥感图像半监督分类算法DE-self-training。利用少量标记样本作为初始训练集,基于改进的Self-training算法构建初始分类器,对未标记样本进行预测;然后从分类结果中按一定比例随机选取部分样本,连同其类别标记一起加入... 提出了一种高光谱遥感图像半监督分类算法DE-self-training。利用少量标记样本作为初始训练集,基于改进的Self-training算法构建初始分类器,对未标记样本进行预测;然后从分类结果中按一定比例随机选取部分样本,连同其类别标记一起加入训练集中,再用扩大的训练集重新训练分类器,并对剩余的未标记样本进行预测。如此迭代地进行训练-预测-挑选样本扩大训练集过程。同时,在迭代训练过程中,运用基于最近邻域规则的数据剪辑策略对扩大训练集时产生的误标记样本进行过滤,以保证训练集的质量,不断迭代地训练出更精确的分类器,最终使所有未标记样本都获得类别标记。以AVIRIS Indian Pines和Hyperion EO-1 Botswana作为实验数据对DE-self-training算法进行测试,并与基于支持向量机的分类结果作比对。实验表明,DE-self-training算法可以在标记样本数量有限条件下,充分挖掘未标记样本的有用信息,使总体分类精度和Kappa系数都有不同程度的提高。 展开更多
关键词 高光谱遥感图像 半监督分类 数据剪辑
下载PDF
在线半监督Kohonen网络的预抓取手势识别 被引量:1
9
作者 张莉 田彦涛 徐卓君 《电子技术应用》 北大核心 2015年第7期57-60,共4页
为实现智能仿生手的抓取,提高模式识别的实时性和灵敏性,提出一种在线半监督Kohonen网络。该网络针对表面肌电信号(s EMG)的特性,在有监督Kohonen网络基础上,将有监督和无监督网络的优势进行结合,应用数据剪辑方法处理训练集更新识别网... 为实现智能仿生手的抓取,提高模式识别的实时性和灵敏性,提出一种在线半监督Kohonen网络。该网络针对表面肌电信号(s EMG)的特性,在有监督Kohonen网络基础上,将有监督和无监督网络的优势进行结合,应用数据剪辑方法处理训练集更新识别网络,在线识别侧边抓取、球形抓取、三指精确抓取和圆柱形抓取4种预抓取手势。实验表明,与不同Kohonen网络相比,此识别方法具有很好的在线识别能力和正确率。 展开更多
关键词 手势识别 表面肌电信号 在线半监督 KOHONEN网络 数据剪辑
下载PDF
改进的协同训练半监督SVM在油层识别中的应用 被引量:1
10
作者 潘用科 贺紫平 +1 位作者 夏克文 牛文佳 《郑州大学学报(工学版)》 CAS 北大核心 2022年第1期14-19,26,共7页
实际石油测井中有标签数据获取代价昂贵,而大量低廉的无标签数据未被使用,如何利用有限的有标签样本及大量的无标签样本获取准确的油层分布有待解决。半监督学习方法因能同时利用少量有标签样本及大量无标签样本便可获取良好的分类模型... 实际石油测井中有标签数据获取代价昂贵,而大量低廉的无标签数据未被使用,如何利用有限的有标签样本及大量的无标签样本获取准确的油层分布有待解决。半监督学习方法因能同时利用少量有标签样本及大量无标签样本便可获取良好的分类模型而被广泛应用。因此,基于半监督支持向量机(S3VM),提出一种改进的基于量子行为粒子群优化(QPSO)的协同训练S3VM油层识别算法(QPSO-CS3VM)。首先引入多视图的协同训练策略,构造2个独立的初始分类器提高识别精度;然后为提高初始分类精度,引入了量子行为粒子群算法以优化S3VM;最后引入一种改进的近邻数据剪辑方法用于预测无标签样本伪标签的置信度,从而避免因错分样本导致的模型性能恶化的问题。通过对具有代表性的两口井的测井数据进行油层识别,结果表明:改进的协同训练半监督SVM相较于传统的协同训练算法在两口井中的识别率分别提升了5.00百分点和3.12百分点。所提算法油层识别精度较高,有一定的实际应用意义。 展开更多
关键词 半监督支持向量机 协同训练 量子行为粒子群优化 数据剪辑 油层识别
下载PDF
三值光学计算机中MSD加法器的理论和结构 被引量:10
11
作者 金翊 沈云付 +4 位作者 彭俊杰 徐拾义 丁广太 岳东剑 尤海航 《中国科学:信息科学》 CSCD 2011年第5期541-551,共11页
在三值光学计算机中采用MSD加法器,将使这个光学计算机的"三值"和"数据位数众多"两大优势在数值计算中得以充分发挥.以降值设计理论为基础,三值光学计算机既可以随时构造出一个数千位的大加法器来满足计算超大数据... 在三值光学计算机中采用MSD加法器,将使这个光学计算机的"三值"和"数据位数众多"两大优势在数值计算中得以充分发挥.以降值设计理论为基础,三值光学计算机既可以随时构造出一个数千位的大加法器来满足计算超大数据的用户,也可以常备一个数据位数适中的加法器来满足普通用户的需要.引入流水计算技术和发明数据剪辑技术后,常备加法器的效率提高到接近每个时钟输出一个计算结果.MSD加法器的成功,促进了三值光学计算机进行乘法运算、除法器和各类矩阵运算的研究. 展开更多
关键词 三值光学计算机 MSD数字 加法器 流水计算技术 数据剪辑
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部