期刊文献+
共找到350,042篇文章
< 1 2 250 >
每页显示 20 50 100
基于密度峰值聚类的Tri-training算法
1
作者 罗宇航 吴润秀 +3 位作者 崔志华 张翼英 何业慎 赵嘉 《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1189-1198,共10页
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类... Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。 展开更多
关键词 tri-training 半监督学习 密度峰值聚类 空间结构 分类器
下载PDF
基于改进Tri-training算法投票机制的中文问句分类
2
作者 王雷 孙中全 《长春师范大学学报》 2023年第12期60-65,101,共7页
原始的Tri-training算法在三个分类器给出的分类结果均不同时,默认第一个分类器给出的分类结果为分类器模型的最终结果,这在一定程度上有可能会降低分类器在这种情况下的分类精度。本文提出一种基于平时优秀思想的投票机制算法,该算法... 原始的Tri-training算法在三个分类器给出的分类结果均不同时,默认第一个分类器给出的分类结果为分类器模型的最终结果,这在一定程度上有可能会降低分类器在这种情况下的分类精度。本文提出一种基于平时优秀思想的投票机制算法,该算法避免了默认将第一个分类器给出的结果作为分类器模型的分类结果这种片面的情况,并利用其对哈工大中文问句集和本文扩展问句集进行分类实验。结果表明,本文算法有良好的适应性,且分类正确率明显提高;适当增大训练集和未标记样本数据,可以增强分类器的泛化能力,从而使分类正确率提高。 展开更多
关键词 tri-training算法 投票机制 问句分类
下载PDF
基于Tri-training算法的多分类信用评级方法 被引量:1
3
作者 曹欣妍 周杰 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期13-18,共6页
随着经济的快速发展,信用贷款在企业资金周转中的作用越来越重要.信用评级是信用贷款发放的基本依据之一.本文针对实际信用评级中有标签样本数量不足的问题,提出一种基于Tri-training算法的多分类信用评级方法,该方法选择支持向量机、... 随着经济的快速发展,信用贷款在企业资金周转中的作用越来越重要.信用评级是信用贷款发放的基本依据之一.本文针对实际信用评级中有标签样本数量不足的问题,提出一种基于Tri-training算法的多分类信用评级方法,该方法选择支持向量机、决策树和最大熵模型作为基分类器组合.最后,本文使用真实的信用数据集验证了该方法的实际效果. 展开更多
关键词 多分类信用评级 半监督学习 tri-training
下载PDF
基于自适应剪辑与概率参数的Tri-Training算法 被引量:1
4
作者 李松 吴润秀 +1 位作者 康平 赵嘉 《江西师范大学学报(自然科学版)》 CAS 北大核心 2023年第5期490-496,共7页
半监督学习利用少量标签数据和大量的无标签数据进行学习.Tri-training是一种基于分歧的半监督分类算法,在进行伪标记时会因误标记而使训练集产生噪声,从而导致算法分类性能下降.为了减少误标记对算法分类性能的影响,该文提出一种基于... 半监督学习利用少量标签数据和大量的无标签数据进行学习.Tri-training是一种基于分歧的半监督分类算法,在进行伪标记时会因误标记而使训练集产生噪声,从而导致算法分类性能下降.为了减少误标记对算法分类性能的影响,该文提出一种基于自适应剪辑与概率参数的Tri-training算法(ADPT).新算法利用基于最近邻的RemoveOnly数据剪辑技术对触发自适应剪辑策略的标记数据进行噪声识别及剔除,而未触发自适应剪辑策略的标记数据则用概率参数方法对噪声进行识别及剔除.为验证本文算法的分类性能,采用4个评价指标,在9组UCI数据集上进行实验,并与相关算法进行比较.实验结果表明:该算法在准确率、精度、召回率及F_(measure)等评价指标上与其他算法相比,具有明显优势. 展开更多
关键词 半监督学习 自适应策略 概率参数 三体训练算法
下载PDF
Tri-training算法中分类器组合的改进 被引量:4
5
作者 李心磊 杨思春 彭月娥 《苏州科技学院学报(自然科学版)》 CAS 2014年第2期52-56,共5页
Tri-training算法是半监督协同算法里的经典算法,该文针对算法中分类器的使用做了一些改进,由原先单一的分类器换成两个不同分类器的组合。使用SVM分类器和最大熵分类器的不同组合作为Tri-training算法里的三个分类器构成分类器模型,然... Tri-training算法是半监督协同算法里的经典算法,该文针对算法中分类器的使用做了一些改进,由原先单一的分类器换成两个不同分类器的组合。使用SVM分类器和最大熵分类器的不同组合作为Tri-training算法里的三个分类器构成分类器模型,然后分别对稀疏型数据、密集型数据与原始Tri-training算法进行实验比较,从而验证改进的有效性。 展开更多
关键词 半监督学习 最大熵 tri-training算法
下载PDF
基于交叉熵的安全Tri-training算法 被引量:4
6
作者 张永 陈蓉蓉 张晶 《计算机研究与发展》 EI CSCD 北大核心 2021年第1期60-69,共10页
半监督学习方法通过少量标记数据和大量未标记数据来提升学习性能.Tri-training是一种经典的基于分歧的半监督学习方法,但在学习过程中可能产生标记噪声问题.为了减少Tri-training中的标记噪声对未标记数据的预测偏差,学习到更好的半监... 半监督学习方法通过少量标记数据和大量未标记数据来提升学习性能.Tri-training是一种经典的基于分歧的半监督学习方法,但在学习过程中可能产生标记噪声问题.为了减少Tri-training中的标记噪声对未标记数据的预测偏差,学习到更好的半监督分类模型,用交叉熵代替错误率以更好地反映模型预估结果和真实分布之间的差距,并结合凸优化方法来达到降低标记噪声的目的,保证模型效果.在此基础上,分别提出了一种基于交叉熵的Tri-training算法、一个安全的Tri-training算法,以及一种基于交叉熵的安全Tri-training算法.在UCI(University of California Irvine)机器学习库等基准数据集上验证了所提方法的有效性,并利用显著性检验从统计学的角度进一步验证了方法的性能.实验结果表明,提出的半监督学习方法在分类性能方面优于传统的Tri-training算法,其中基于交叉熵的安全Tri-training算法拥有更高的分类性能和泛化能力. 展开更多
关键词 半监督学习 tri-training算法 交叉熵 凸优化 样本标记
下载PDF
基于Tri-training算法的构造性学习方法 被引量:3
7
作者 吴涛 李萍 王允强 《计算机工程》 CAS CSCD 2012年第6期13-15,共3页
构造性机器学习(CML)算法在训练分类器时需要大量有标记样本,而获取这些有标记样本十分困难。为此,提出一种基于Tri-training算法的构造性学习方法。根据已标记的样本,采用不同策略构造3个差异较大的初始覆盖分类网络,用于对未标记数据... 构造性机器学习(CML)算法在训练分类器时需要大量有标记样本,而获取这些有标记样本十分困难。为此,提出一种基于Tri-training算法的构造性学习方法。根据已标记的样本,采用不同策略构造3个差异较大的初始覆盖分类网络,用于对未标记数据进行标记,再将已标记数据加入到训练样本中,调整各分类网络参数,反复进行上述过程,直至获得稳定的分类器。实验结果证明,与CML算法和基于NB分类器的半监督学习算法相比,该方法的分类准确率更高。 展开更多
关键词 半监督学习 构造性机器学习 tri-training算法 覆盖 分类网络
下载PDF
基于改进Tri-training算法的中文问句分类 被引量:1
8
作者 王雷 杨思春 《安徽工业大学学报(自然科学版)》 CAS 2016年第2期172-176,共5页
原始Tri-training算法对有标记的数据集通过随机采样方法,形成3个训练集去训练3个分类器。但是由这种随机采样形成的训练集中,可能出现有标记数据集中的不同类别数据数量相差较大,从而导致训练集中样本类别不平衡问题,影响分类器的分类... 原始Tri-training算法对有标记的数据集通过随机采样方法,形成3个训练集去训练3个分类器。但是由这种随机采样形成的训练集中,可能出现有标记数据集中的不同类别数据数量相差较大,从而导致训练集中样本类别不平衡问题,影响分类器的分类正确率。本文通过分类采样对Tri-training算法的随机采样方法进行改进,根据该改进的Tri-training算法,建立分类模型,并利用其对哈工大中文问句集和本文扩展问句集进行分类实验。结果表明,本文算法有良好的适应性,且分类正确率明显提高;适当增大训练集和未标记样本数据可以增强分类器的泛化能力,从而使分类正确率提高。 展开更多
关键词 tri-training算法 随机采样 问句分类
下载PDF
基于自适应数据剪辑策略的Tri-training算法 被引量:14
9
作者 邓超 郭茂祖 《计算机学报》 EI CSCD 北大核心 2007年第8期1213-1226,共14页
Tri-training能有效利用无标记样例提高泛化能力.针对Tri-training迭代中无标记样例常被错误标记而形成训练集噪声,导致性能不稳定的缺点,文中提出ADE-Tri-training(Tri-training with Adaptive Data Editing)新算法.它不仅利用Remove O... Tri-training能有效利用无标记样例提高泛化能力.针对Tri-training迭代中无标记样例常被错误标记而形成训练集噪声,导致性能不稳定的缺点,文中提出ADE-Tri-training(Tri-training with Adaptive Data Editing)新算法.它不仅利用Remove Only剪辑操作对每次迭代可能产生的误标记样例识别并移除,更重要的是采用自适应策略来确定Remove Only触发与抑制的恰当时机.文中证明,PAC理论下自适应策略中一系列判别充分条件可同时确保新训练集规模迭代增大和新假设分类错误率迭代降低更多.UCI数据集上实验结果表明:ADE-Tri-training具有更好的分类泛化性能和健壮性. 展开更多
关键词 半监督学习 数据剪辑 自适应策略 PAC可学习 tri-training
下载PDF
基于改进Tri-Training算法的大数据保险业客户分类研究
10
作者 林志鸿 《韶关学院学报》 2018年第3期24-27,共4页
保险行业正处于比较快速的发展阶段,为了能够盈利,构建良好的客户关系是非常关键的,可利用改进TriTraining算法对大数据保险业客户进行分类.首先确定保险业客户细分的指标;其次分析改进Tri-Training分类算法的基本理论;再次设计基于改进... 保险行业正处于比较快速的发展阶段,为了能够盈利,构建良好的客户关系是非常关键的,可利用改进TriTraining算法对大数据保险业客户进行分类.首先确定保险业客户细分的指标;其次分析改进Tri-Training分类算法的基本理论;再次设计基于改进Tri-Training算法的大数据保险业客户分类流程;最后进行大数据保险业客户的分类实例研究,研究结果表明改进Tri-Training算法能够有效地提升保险业客户分类的精度. 展开更多
关键词 保险业 大数据 客户分类 改进tri-training算法
下载PDF
基于Tri-Training算法的数据编辑技术
11
作者 张雁 林英 吕丹桔 《计算机与数字工程》 2013年第10期1583-1585,共3页
Tri-Training是一种半监督学习算法,在少量标记数据下,通过三个不同的分类器,从未标记样本中采样并标记新的训练数据,作为各分类器训练数据的有效补充。但由于错误标记样本的存在,引入了噪音数据,降低了分类的性能。论文在Tri-Training... Tri-Training是一种半监督学习算法,在少量标记数据下,通过三个不同的分类器,从未标记样本中采样并标记新的训练数据,作为各分类器训练数据的有效补充。但由于错误标记样本的存在,引入了噪音数据,降低了分类的性能。论文在Tri-Training算法中分别采用DE-KNN,DE-BKNN和DE-NED三种数据编辑技术,识别移除误标记的数据。通过对六组UCI数据集的实验,分析结果表明,编辑技术的引入是有效的,三种方法的使用在一定程度上提升了Tri-Training算法的分类性能,尤其是DE-NED方法更为显著。 展开更多
关键词 半监督学习 Tri—Training算法 数据编辑
下载PDF
基于Tri-Training算法的中文电子病历实体识别研究 被引量:6
12
作者 王润奇 关毅 《智能计算机与应用》 2017年第6期132-134,138,共4页
半监督学习是一种结合监督学习与无监督学习的学习方法,通过利用未标记数据,提高标记数据所建立模型的效果,目的是减少传统的机器学习任务中对大量标注数据的需求、降低人工成本。在中文电子病历实体识别领域,由于缺少足够的标注数据,... 半监督学习是一种结合监督学习与无监督学习的学习方法,通过利用未标记数据,提高标记数据所建立模型的效果,目的是减少传统的机器学习任务中对大量标注数据的需求、降低人工成本。在中文电子病历实体识别领域,由于缺少足够的标注数据,且医学文本专业性较强、人工标注成本高,可以利用半监督学习方法,提升少量标注数据的训练效果。本文介绍了中文电子病历实体识别的研究背景和半监督学习的相关研究,并应用改进后的Tri-Training算法,提升中文电子病历实体识别模型的效果。 展开更多
关键词 实体识别 半监督学习 tri-training
下载PDF
利用Tri-training算法解决推荐系统冷启动问题 被引量:6
13
作者 张栩晨 《计算机科学》 CSCD 北大核心 2016年第12期108-114,共7页
随着社交网络的发展,推荐系统日趋重要,而冷启动问题是推荐系统中的关键问题。设计了一种基于上下文的半监督学习框架TSEL,对矩阵分解模型SVD进行扩充以支持更多形式的上下文信息,利用Tri-training框架训练各个模型。与其他解决推荐系... 随着社交网络的发展,推荐系统日趋重要,而冷启动问题是推荐系统中的关键问题。设计了一种基于上下文的半监督学习框架TSEL,对矩阵分解模型SVD进行扩充以支持更多形式的上下文信息,利用Tri-training框架训练各个模型。与其他解决推荐系统冷启动问题的半监督方法(如Co-training)相比,该方法有着更好的效果。Tri-training框架能够更加方便地引入更多推荐模型,具有更好的可扩展性。将Tri-training框架加以扩展,提出了基于用户活跃度生成无标记教学集合的算法和更加丰富的对矩阵分解模型扩充的形式。在真实数据集MovieLens上进行验证,获得了更好的实验效果。 展开更多
关键词 推荐系统 机器学习 tri-training
下载PDF
融合光谱度量标记迁移和Tri-training的高光谱遥感图像半监督分类算法
14
作者 曹峰 李文涛 +4 位作者 骆剑承 李德玉 钱宇华 白鹤翔 张超 《大数据》 2023年第6期72-89,共18页
针对海量的高光谱遥感图像光谱和丰富的空间信息中可用于分类的有标记样本远少于无标记样本的数据特性,提出了一种融合光谱度量标记迁移和Tri-training的高光谱遥感图像半监督光谱-空间分类算法。该算法提出了一种基于光谱度量的标记迁... 针对海量的高光谱遥感图像光谱和丰富的空间信息中可用于分类的有标记样本远少于无标记样本的数据特性,提出了一种融合光谱度量标记迁移和Tri-training的高光谱遥感图像半监督光谱-空间分类算法。该算法提出了一种基于光谱度量的标记迁移方法,通过结合迁移标记和Tri-training预测标记进行扩充样本标记预测,提高了扩充样本标记的准确性。同时,该算法基于空间相关性选择扩充样本,综合运用光谱和空间特征提升图像分类的精度。在两个公开的高光谱遥感图像数据集上进行了实验,结果表明该算法优于基于Tri-training算法的高光谱遥感图像的分类性能。 展开更多
关键词 高光谱图像分类 半监督分类 纹理特征 光谱度量 tri-training算法
下载PDF
基于Tri-training-SSAE半监督学习算法的电力系统暂态稳定评估 被引量:1
15
作者 卫志农 李超凡 +4 位作者 丁爱飞 孙国强 黄蔓云 臧海祥 方熙程 《电力自动化设备》 EI CSCD 北大核心 2023年第7期110-116,共7页
基于机器学习的暂态稳定评估方法主要采用监督学习方法,为了解决监督学习方法所需的有标签样本难以获取的问题,提出基于三体训练-稀疏堆叠自动编码器(Tri-training-SSAE)半监督学习算法的电力系统暂态稳定评估方法。构建基于堆叠稀疏自... 基于机器学习的暂态稳定评估方法主要采用监督学习方法,为了解决监督学习方法所需的有标签样本难以获取的问题,提出基于三体训练-稀疏堆叠自动编码器(Tri-training-SSAE)半监督学习算法的电力系统暂态稳定评估方法。构建基于堆叠稀疏自动编码器的暂态稳定评估模型;在传统的三体训练过程中加入伪标签样本置信度判断,以减小噪声数据对模型训练的影响;以堆叠稀疏自动编码器为基分类器构建三体训练-稀疏堆叠自动编码器模型,利用大量的无标签样本提高模型的泛化能力。通过IEEE 39节点系统与华东某省级电网进行分析验证,结果表明,所提方法在有标签样本数较少时具有更高的评估准确度。 展开更多
关键词 暂态稳定评估 机器学习 半监督学习 三体训练算法 堆叠稀疏自动编码器
下载PDF
基于Tri-training的社交媒体药物不良反应实体抽取
16
作者 何忠玻 严馨 +2 位作者 徐广义 张金鹏 邓忠莹 《计算机工程与应用》 CSCD 北大核心 2024年第3期177-186,共10页
社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题... 社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题,采用Tri-training半监督的方法进行社交媒体药物不良反应实体抽取,通过三个学习器Transformer+CRF、BiLSTM+CRF和IDCNN+CRF对未标注数据进行标注,再利用一致性评价函数迭代地扩展训练集,最后通过加权投票整合模型输出标签。针对社交媒体的文本不正式性(口语化严重、错别字等)问题,通过融合字与词两个粒度的向量作为整个模型嵌入层的输入,来提取更丰富的语义信息。实验结果表明,提出的模型在“好大夫在线”网站获取的数据集上取得了良好表现。 展开更多
关键词 中文社交媒体 药物不良反应 实体抽取 半监督学习 tri-training
下载PDF
一种自适应的Tri-Training半监督算法 被引量:1
17
作者 彭雅琴 宫宁生 《计算机系统应用》 2016年第8期130-134,共5页
Tri-Training算法是半监督算法的一种,在学习过程中容易错误标注无标记样本,从而降低分类性能,为此提出一种ADP-Tri-Training(Adaptive Tri-Training)算法,改进协同工作方式,根据几何中心设置分类器组成,然后应用模糊数学理论将多个独... Tri-Training算法是半监督算法的一种,在学习过程中容易错误标注无标记样本,从而降低分类性能,为此提出一种ADP-Tri-Training(Adaptive Tri-Training)算法,改进协同工作方式,根据几何中心设置分类器组成,然后应用模糊数学理论将多个独立的分类器组合,使得算法可以在多因素下综合评价样本,并在此基础上引入遗传算法动态设置组合权重以适应于具体的样本集,从而尽可能降低样本标注的错误率,多个实验结果表明ADP-Tri-Training算法具有更好的分类性能. 展开更多
关键词 tri-training算法 自适应 遗传算法 差异性度量 半监督
下载PDF
基于Tri-training直推式支持向量机算法
18
作者 杜红乐 张燕 《河南科学》 2017年第7期1032-1036,共5页
针对直推式支持向量机错误累积及获取无标记样本空间信息慢的问题,结合Tri-training算法、KKT条件及富信息策略提出一种基于Tri-training的直推式支持向量机算法,用KKT条件选择标注样本,用富信息策略选择加入的分类器,利用多个分类器的... 针对直推式支持向量机错误累积及获取无标记样本空间信息慢的问题,结合Tri-training算法、KKT条件及富信息策略提出一种基于Tri-training的直推式支持向量机算法,用KKT条件选择标注样本,用富信息策略选择加入的分类器,利用多个分类器的投票结果进行标注,提高样本标注的准确度,利用多个分类器进行协同训练提高算法的训练速度.最后实验结果表明,算法能够提高最终分类器的分类精度和算法的训练速度. 展开更多
关键词 支持向量机 直推式学习 半监督学习 tri-training算法
下载PDF
基于Tri-training的半监督多标记学习算法 被引量:4
19
作者 刘杨磊 梁吉业 +1 位作者 高嘉伟 杨静 《智能系统学报》 CSCD 北大核心 2013年第5期439-445,共7页
传统的多标记学习是监督意义下的学习,它要求获得完整的类别标记.但是当数据规模较大且类别数目较多时,获得完整类别标记的训练样本集是非常困难的.因而,在半监督协同训练思想的框架下,提出了基于Tri-training的半监督多标记学习算法(SM... 传统的多标记学习是监督意义下的学习,它要求获得完整的类别标记.但是当数据规模较大且类别数目较多时,获得完整类别标记的训练样本集是非常困难的.因而,在半监督协同训练思想的框架下,提出了基于Tri-training的半监督多标记学习算法(SMLT).在学习阶段,SMLT引入一个虚拟类标记,然后针对每一对类别标记,利用协同训练机制Tri-training算法训练得到对应的分类器;在预测阶段,给定一个新的样本,将其代入上述所得的分类器中,根据类别标记得票数的多少将多标记学习问题转化为标记排序问题,并将虚拟类标记的得票数作为阈值对标记排序结果进行划分.在UCI中4个常用的多标记数据集上的对比实验表明,SMLT算法在4个评价指标上的性能大多优于其他对比算法,验证了该算法的有效性. 展开更多
关键词 多标记学习 半监督学习 tri-training
下载PDF
基于Tri-Training和数据剪辑的半监督聚类算法 被引量:30
20
作者 邓超 郭茂祖 《软件学报》 EI CSCD 北大核心 2008年第3期663-673,共11页
提出一种半监督聚类算法,该算法在用seeds集初始化聚类中心前,利用半监督分类方法Tri-training的迭代训练过程对无标记数据进行标记,并加入seeds集以扩大规模;同时,在Tri-training训练过程中结合基于最近邻规则的Depuration数据剪辑技术... 提出一种半监督聚类算法,该算法在用seeds集初始化聚类中心前,利用半监督分类方法Tri-training的迭代训练过程对无标记数据进行标记,并加入seeds集以扩大规模;同时,在Tri-training训练过程中结合基于最近邻规则的Depuration数据剪辑技术对seeds集扩大过程中产生的误标记噪声数据进行修正、净化,以提高seeds集质量.实验结果表明,所提出的基于Tri-training和数据剪辑的DE-Tri-training半监督聚类新算法能够有效改善seeds集对聚类中心的初始化效果,提高聚类性能. 展开更多
关键词 半监督聚类 半监督分类 K-均值 seeds集 tri-training Depuration数据剪辑
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部