期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
基于偏侧分类间隔的多标签SVM主动学习 被引量:1
1
作者 许钰 《电脑知识与技术(过刊)》 2012年第12X期8349-8352,共4页
为了解决多标签SVM主动学习对不均衡数据集学习效率低下问题,该文提出一种基于偏侧分类间隔的SVM主动学习选择策略,即依据当前分类器,选择样本数量少,位于分类超平面一侧分类间隔中间的正类样本进行标记,加入训练集,训练分类器。实验证... 为了解决多标签SVM主动学习对不均衡数据集学习效率低下问题,该文提出一种基于偏侧分类间隔的SVM主动学习选择策略,即依据当前分类器,选择样本数量少,位于分类超平面一侧分类间隔中间的正类样本进行标记,加入训练集,训练分类器。实验证明在相同训练样本情况下,基于偏侧分类间隔的选择策略与传统的基于版本空间SVM主动学习选择策略相比能够获得更高分类精度。 展开更多
关键词 多标签svm主动学习 不均衡数据集 偏侧分类间隔 选择策略
下载PDF
基于加权SVM主动学习的多标签分类 被引量:7
2
作者 刘端阳 邱卫杰 《计算机工程》 CAS CSCD 北大核心 2011年第8期181-182,185,共3页
样本标记是一个重要但又比较耗时的过程。得到一个多标签分类器需要大量的训练样本,而手工为每个样本创建多个标签会存在一定困难。为尽可能降低标记样本的工作量,提出一种加权决策函数的主动学习方法,该方法同时考虑训练样本的数量和... 样本标记是一个重要但又比较耗时的过程。得到一个多标签分类器需要大量的训练样本,而手工为每个样本创建多个标签会存在一定困难。为尽可能降低标记样本的工作量,提出一种加权决策函数的主动学习方法,该方法同时考虑训练样本的数量和未知样本的置信度,使得分类器能在最小的成本下最快地达到比较满意的分类精度。 展开更多
关键词 主动学习 多标签 支持向量机 训练样本
下载PDF
基于SVM期望间隔的多标签分类的主动学习 被引量:7
3
作者 刘端阳 邱卫杰 《计算机科学》 CSCD 北大核心 2011年第4期230-232,266,共4页
分类是数据挖掘领域研究中的核心技术之一。得到一个性能良好的分类器需要大量的训练样本,而对样本进行标记是一个十分消耗资源的过程,对多标签样本进行标记就更加困难。为了尽可能降低标记样本的成本,需要找出最能代表类别信息的样本... 分类是数据挖掘领域研究中的核心技术之一。得到一个性能良好的分类器需要大量的训练样本,而对样本进行标记是一个十分消耗资源的过程,对多标签样本进行标记就更加困难。为了尽可能降低标记样本的成本,需要找出最能代表类别信息的样本。在基于SVM的分类方法中,分类器间隔越大,分类的精度就会越差。提出了一种基于期望间隔的主动学习方法,即依据当前分类器,选择最快缩小分类间隔的样本。通过实验证明,基于期望间隔的学习策略比基于决策值以及基于后验概率的策略有着更好的学习效果。 展开更多
关键词 多标签 后验概率 期望间隔 主动学习 支持向量机
下载PDF
基于SVM的多示例多标签主动学习 被引量:4
4
作者 李杰龙 肖燕珊 +2 位作者 郝志峰 阮奕邦 张丽阳 《计算机工程与设计》 北大核心 2016年第1期254-258,共5页
针对近年出现的多示例多标签学习,把主动学习应用到其框架上,提出一种基于支持向量机最小分类距离的多示例多标签主动学习方法。引入支持向量机的最小分类距离,提出分类器对未标记多示例包的置信度,在学习过程中,迭代地主动选择最能改... 针对近年出现的多示例多标签学习,把主动学习应用到其框架上,提出一种基于支持向量机最小分类距离的多示例多标签主动学习方法。引入支持向量机的最小分类距离,提出分类器对未标记多示例包的置信度,在学习过程中,迭代地主动选择最能改善分类器性能的未标记多示例包添加到训练集中进行学习,有效减少训练多示例包的成本,改善分类器性能。实验结果表明,与样本随机选择策略相比,该方法在训练样本相同的情况下能够获得更好的分类性能。 展开更多
关键词 主动学习 多示例多标签学习 支持向量机 最小分类距离 置信度
下载PDF
基于反向标签传播的多生成器主动学习算法及其在离群点检测中的应用研究
5
作者 邢开颜 陈文 《计算机科学》 CSCD 北大核心 2024年第4期359-365,共7页
当前正负类训练样本分布不均衡的问题已极大地限制了离群检测模型的性能。基于主动学习的离群点检测算法能够通过对样本分布的主动学习,自动合成离群点以平衡训练数据分布。然而,传统的基于主动学习的检测方法缺乏对合成离群点的质量评... 当前正负类训练样本分布不均衡的问题已极大地限制了离群检测模型的性能。基于主动学习的离群点检测算法能够通过对样本分布的主动学习,自动合成离群点以平衡训练数据分布。然而,传统的基于主动学习的检测方法缺乏对合成离群点的质量评估和过滤筛选,导致通过主动学习过程合成的训练样本点中存在样本噪声,并降低了分类模型的性能。针对上述问题,提出了基于反向标签传播的多生成器主动学习算法(Multi-Generator Active Learning Algorithm Based on Reverse Label Propagation,MG-RLP),其包括多个神经网络生成器和一个用于离群点边界检测的鉴别器。MG-RLP通过多个子生成器生成多分布特征的样本数据,以防止单生成器合成的训练样本过于聚集而导致的模式崩塌问题。同时,MG-RLP利用反向标签传播过程对神经网络生成的样本点进行质量评估,以筛选出可信的合成样本。筛选后的样本被保留在训练样本中用于对鉴别器进行迭代训练,以提升对离群点的检测性能。基于5个公共数据集,对比验证了MG-RLP与6种典型的离群点检测算法的性能,结果表明,MG-RLP在AUC和检测精度指标上分别提高了15%和22%,结果验证了MG-RLP的有效性。 展开更多
关键词 离群点检测 主动学习 生成对抗网络 标签传播
下载PDF
基于未标签信息主动学习算法的高光谱影像分类 被引量:8
6
作者 张良 罗祎敏 +2 位作者 马洪超 张帆 胡川 《计算机应用》 CSCD 北大核心 2017年第6期1768-1771,共4页
针对高光谱遥感影像分类中,传统的主动学习算法仅利用已标签数据训练样本,大量未标签数据被忽视的问题,提出一种结合未标签信息的主动学习算法。首先,通过K近邻一致性原则、前后预测一致性原则和主动学习算法信息量评估3重筛选得到预测... 针对高光谱遥感影像分类中,传统的主动学习算法仅利用已标签数据训练样本,大量未标签数据被忽视的问题,提出一种结合未标签信息的主动学习算法。首先,通过K近邻一致性原则、前后预测一致性原则和主动学习算法信息量评估3重筛选得到预测标签可信度高并具备一定信息量的未标签样本;然后,将其预测标签当作真实标签加入到标签样本集中;最后,训练得到更优质的分类模型。实验结果表明,与被动学习算法和传统的主动学习算法相比,所提算法能够在同等标记的代价下获得更高的分类精度,同时具有更好的参数敏感性。 展开更多
关键词 高光谱遥感 主动学习 图像分类 标签信息.
下载PDF
结合Tri-training半监督学习和凸壳向量的SVM主动学习算法 被引量:6
7
作者 徐海龙 龙光正 +2 位作者 别晓峰 吴天爱 郭蓬松 《模式识别与人工智能》 EI CSCD 北大核心 2016年第1期39-46,共8页
为解决监督学习过程中难以获得大量带有类标记样本且样本数据标记代价较高的问题,结合主动学习和半监督学习方法,提出基于Tri-training半监督学习和凸壳向量的SVM主动学习算法.通过计算样本集的壳向量,选择最有可能成为支持向量的壳向... 为解决监督学习过程中难以获得大量带有类标记样本且样本数据标记代价较高的问题,结合主动学习和半监督学习方法,提出基于Tri-training半监督学习和凸壳向量的SVM主动学习算法.通过计算样本集的壳向量,选择最有可能成为支持向量的壳向量进行标记.为解决以往主动学习算法在选择最富有信息量的样本标记后,不再进一步利用未标记样本的问题,将Tri-training半监督学习方法引入SVM主动学习过程,选择类标记置信度高的未标记样本加入训练样本集,利用未标记样本集中有利于学习器的信息.在UCI数据集上的实验表明,文中算法在标记样本较少时获得分类准确率较高和泛化性能较好的SVM分类器,降低SVM训练学习的样本标记代价. 展开更多
关键词 主动学习 半监督学习 支持向量机(svm) 凸壳向量 Tri—training算法
下载PDF
基于主动学习SVM的变压器局部放电模式识别 被引量:3
8
作者 尚海昆 徐扬 +1 位作者 苑津莎 李洪强 《华北电力大学学报(自然科学版)》 CAS 北大核心 2013年第4期27-31,106,共6页
对局部放电类型进行有效识别是准确评估变压器绝缘状态的重要前提。然而放电类型识别过程中往往需要大量训练样本的学习才能达到较高的识别精度。针对这种情况,提出一种基于主动学习支持向量机的局部放电模式识别新方法。该方法在选择... 对局部放电类型进行有效识别是准确评估变压器绝缘状态的重要前提。然而放电类型识别过程中往往需要大量训练样本的学习才能达到较高的识别精度。针对这种情况,提出一种基于主动学习支持向量机的局部放电模式识别新方法。该方法在选择训练样本的过程中采用主动学习的方法,挑选出对分类器最有价值的放电样本进行训练。研究结果表明,该方法在保障识别精度的前提下有效减少了放电信号需要的训练样本个数,缩短了训练时间,提高了样本的学习效率。 展开更多
关键词 svm 主动学习 变压器 局部放电 识别
下载PDF
基于自监督的主动标签清洗
9
作者 林晓 张秋阳 +1 位作者 郑晓妹 杨启哲 《图学学报》 CSCD 北大核心 2024年第3期495-504,共10页
主动标签清洗利用主动学习来进行标签噪声处理,以降低人工标注成本。现有的主动标签清洗方法仍然存在人工额外标注成本较高的问题,即挑选出的可疑样本中正确样本所占比例较高。为了缓解这一问题,提出了一种基于核心集的自监督主动标签... 主动标签清洗利用主动学习来进行标签噪声处理,以降低人工标注成本。现有的主动标签清洗方法仍然存在人工额外标注成本较高的问题,即挑选出的可疑样本中正确样本所占比例较高。为了缓解这一问题,提出了一种基于核心集的自监督主动标签清洗方法。首先利用自监督任务进行表征学习,随后将数据映射到特征空间中,并利用贪婪的K-Center集合覆盖方法挑选出可疑样本,最后根据不确定性筛选出标签噪声样本进行重标注。并同时考虑到了样本的代表性与不确定性,能够有效降低可疑样本中正确样本的比例。在含有不同比例标签噪声的公开数据集上的实验结果表明,在各迭代轮次中明显地降低了人工额外标注成本,同时也在一定程度上缓解了冷启动问题。此外,还通过消融实验证明了方法中自监督核心集采样模块和不确定性预测模块的有效性。 展开更多
关键词 主动学习 自监督学习 标签噪声 标签清洗 人工额外标注成本
下载PDF
基于球结构支持向量机的多标签分类的主动学习 被引量:3
10
作者 蒋华 戚玉顺 《计算机应用》 CSCD 北大核心 2012年第5期1359-1361,共3页
为了实现数据的多标签分类,减少多标签训练样本开销,将球结构支持向量机与主动学习方法结合用于多标签分类,依据球重叠区域样本距离差值度确定样本类别,分析多标签分类特性,采用样本近邻方法更新分类器。实验结果表明,该方法可以用较少... 为了实现数据的多标签分类,减少多标签训练样本开销,将球结构支持向量机与主动学习方法结合用于多标签分类,依据球重叠区域样本距离差值度确定样本类别,分析多标签分类特性,采用样本近邻方法更新分类器。实验结果表明,该方法可以用较少的训练样本获得更有效的分类结果。 展开更多
关键词 球结构支持向量机 欧氏距离 多标签分类 多类分类 主动学习方法
下载PDF
结合主动学习与标签传递算法的高光谱图像分类 被引量:3
11
作者 王立国 商卉 石瑶 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2020年第5期731-737,共7页
与自然真彩色图像相比,高光谱图像维数高、有标记的数据少。针对传统的分类方法主要利用光谱特征忽略了空间信息的提取的问题,本文提出了一种基于空-谱信息融合的主动学习与标签传递算法相结合的分类框架。基于概率模型的BT(Breaking Ti... 与自然真彩色图像相比,高光谱图像维数高、有标记的数据少。针对传统的分类方法主要利用光谱特征忽略了空间信息的提取的问题,本文提出了一种基于空-谱信息融合的主动学习与标签传递算法相结合的分类框架。基于概率模型的BT(Breaking Ties,BT)策略筛选出具有代表性的未标记样本,作为新的训练样本扩充训练样本集。标签传递算法推测未标记样本真正的类别信息,由分类器进行重新训练。实验表明:在有标签样本不充足的情况下,Indian Pines数据集分类精度达到76.89%,帕维亚大学数据集分类精度为95.23%,优于现有的几种分类算法。在标签样本稀缺的情况下,本文算法可以利用半监督学习与主动学习相结合的方法有效提高分类精度。 展开更多
关键词 高光谱图像 半监督分类 空谱信息 主动学习 标签传递 主成分分析 GABOR滤波 支持向量机
下载PDF
基于平均期望间隔的多标签分类主动学习方法 被引量:1
12
作者 刘端阳 邱卫杰 《计算机工程》 CAS CSCD 北大核心 2011年第15期168-170,共3页
针对多标签主动学习速度较慢的问题,提出一种基于平均期望间隔的多标签分类的主动学习方法。计算支持向量机分类器中的期望间隔,并将其作为样本选择标准。实验结果表明,该方法在分类精度、Hamming Loss、Coverage等评价标准上优于基于... 针对多标签主动学习速度较慢的问题,提出一种基于平均期望间隔的多标签分类的主动学习方法。计算支持向量机分类器中的期望间隔,并将其作为样本选择标准。实验结果表明,该方法在分类精度、Hamming Loss、Coverage等评价标准上优于基于决策值和后验概率等主动学习策略,能更好地评价未标记样本,有效提高分类精度和速度。 展开更多
关键词 多标签 后验概率 期望间隔 主动学习 支持向量机
下载PDF
基于多视角二维主动学习的多标签分类 被引量:3
13
作者 张晓宇 《高技术通讯》 CAS CSCD 北大核心 2011年第12期1312-1317,共6页
针对多标签图像分类问题的特点,提出了一种多视角二维主动学习(MV-2DAL)算法,以通过多视角学习与主动学习的有机结合,深入挖掘样本、标签、视角三个维度上的相关性和冗余性。此算法以样本.标签对作为基本标注单位,在每个视角内... 针对多标签图像分类问题的特点,提出了一种多视角二维主动学习(MV-2DAL)算法,以通过多视角学习与主动学习的有机结合,深入挖掘样本、标签、视角三个维度上的相关性和冗余性。此算法以样本.标签对作为基本标注单位,在每个视角内,利用二维主动学习的方法计算样本、标签维度上的不确定度;在不同视角间,通过多视角融合的方法计算跨视角的不确定度;最终,将视角内不确定度与视角间不确定度进行融合得到总不确定度,并以此衡量样本-标签对的标注价值。将MV-2DAL算法应用到图像内容理解的一个重要领域——多标签图像分类中,显著提高了信息标注的针对性,不仅有效降低了信息冗余度,同时也大幅减少了数据标注量。 展开更多
关键词 主动学习(AL) 多视角学习 多标签分类 图像分类 多模态融合
下载PDF
基于主动学习的SVM评论内容分类算法的研究 被引量:6
14
作者 段友祥 张晓天 《计算机与数字工程》 2022年第3期608-612,共5页
随着信息时代的到来,互联网平台上的文本数据开始爆发式增长,其中难免夹杂着一些不法数据。这些数据往往隐藏在海量数据中,因此给平台检索这些不法数据增加了难度。在这种情况下再用传统的文本分类方法已经不能满足需求了。因此论文根... 随着信息时代的到来,互联网平台上的文本数据开始爆发式增长,其中难免夹杂着一些不法数据。这些数据往往隐藏在海量数据中,因此给平台检索这些不法数据增加了难度。在这种情况下再用传统的文本分类方法已经不能满足需求了。因此论文根据文本数据的特点提出了基于主动学习的SVM评论内容分类方法,该方法使用主动学习的思想将敏感词向量、k-means聚类算法和SVM分类算法结合在一起,在使用更少训练集的基础上提高文本分类的准确率。实验结果表明,使用论文提出的方法对文本进行分类,在分类时间和结果准确率方面上都得到了一定程度的提高。 展开更多
关键词 文本分类 主动学习 K-MEANS svm 敏感词向量
下载PDF
基于SVM主动学习的入侵检测优化算法研究 被引量:3
15
作者 赵运红 《荆楚理工学院学报》 2018年第4期5-9,共5页
目的:拟解决传统的网络入侵检测算法效率低、准确率不高等缺点。方法:优化风险函数,利用最小二乘SVM来改进SVM训练效率,生成一系列加权基学习器,综合生成模型。结果:提出一种基于SVM主动学习的入侵检测优化算法(AL-SVM)。结论:本文算法... 目的:拟解决传统的网络入侵检测算法效率低、准确率不高等缺点。方法:优化风险函数,利用最小二乘SVM来改进SVM训练效率,生成一系列加权基学习器,综合生成模型。结果:提出一种基于SVM主动学习的入侵检测优化算法(AL-SVM)。结论:本文算法在解决高维、小样本、避免局部最优方面有优势,在检测入侵的检测率和误报率方面,与传统的入侵检测算法相比,分别提高和降低了1. 74%~5. 07%和1. 74%~4. 86%。 展开更多
关键词 svm 入侵检测 主动学习 算法 优化
下载PDF
一种基于SVM和主动学习的图像检索方法 被引量:6
16
作者 王新建 罗光春 +2 位作者 秦科 陈爱国 赖云一 《计算机应用研究》 CSCD 北大核心 2016年第12期3836-3838,3846,共4页
为了提高图像检索的速度和准确性,提出了一种基于SVM和主动学习的图像检索方法。该方法分为两个阶段:第一阶段用K-means聚类算法在图像数据库中找出代表性样本,有效地缩小了目标图像的查找范围;第二阶段通过对未标注样本与分类边界之间... 为了提高图像检索的速度和准确性,提出了一种基于SVM和主动学习的图像检索方法。该方法分为两个阶段:第一阶段用K-means聚类算法在图像数据库中找出代表性样本,有效地缩小了目标图像的查找范围;第二阶段通过对未标注样本与分类边界之间的距离以及其近邻密度进行综合评价,选出最有价值的关键性样本作为训练样本,使得分类器可以通过较少的反馈次数快速达到较高的准确性。实验表明,该算法可以有效提高图像的检索性能。 展开更多
关键词 图像检索 svm 主动学习 K—means 代表性样本 关键性样本
下载PDF
基于SVM主动学习的制革企业财务管理数据分类方法
17
作者 高溪 王良浩 《皮革与化工》 CAS 2023年第6期17-22,共6页
制革企业财务管理数据具备不平衡性和非线性特征,导致难以对于数据属性进行标注,因此提出了一种基于SVM主动学习的制革企业财务管理数据分类方法。依靠向量空间模型对制革企业财务管理数据特征项进行提取并降维,将降维后的数据映射到特... 制革企业财务管理数据具备不平衡性和非线性特征,导致难以对于数据属性进行标注,因此提出了一种基于SVM主动学习的制革企业财务管理数据分类方法。依靠向量空间模型对制革企业财务管理数据特征项进行提取并降维,将降维后的数据映射到特征空间。在特征空间利用SVM主动学习机进行数据属性标注,结合分类决策概率实现制革企业财务管理数据分类。仿真实验结果表明,所提方法的制革企业财务管理数据分类效果好,容错率较低,Kappa系数较高,制革企业财务管理数据分类效果更加理想。 展开更多
关键词 svm主动学习 制革企业 财务管理数据 向量空间模型 特征降维 决策概率
下载PDF
基于标签传播和主动学习的人物社会关系抽取 被引量:4
18
作者 刘锦文 许静 +1 位作者 张利萍 芮伟康 《计算机工程》 CAS CSCD 北大核心 2017年第2期234-240,共7页
基于标签传播的半监督学习算法能够提升少量标注数据下的关系抽取效果,但是随机选择训练样本会使关系抽取性能降低。为了从海量的网络信息中提取出可靠性较高的人物关系,将标签传播算法与主动学习相结合用于人物关系抽取。在训练数据获... 基于标签传播的半监督学习算法能够提升少量标注数据下的关系抽取效果,但是随机选择训练样本会使关系抽取性能降低。为了从海量的网络信息中提取出可靠性较高的人物关系,将标签传播算法与主动学习相结合用于人物关系抽取。在训练数据获取中,主动选择不确定性最大的样本进行标注。在人物关系上的实验结果显示,主动学习方法的引入可使平均F1值比标签传播算法提升2.3%。 展开更多
关键词 人物社会关系 特征提取 标签传播 主动学习 关系抽取 半监督学习
下载PDF
页岩气储层预测的多标签主动学习算法 被引量:2
19
作者 汪敏 冯婷婷 +3 位作者 闵帆 唐洪明 闫建平 廖纪佳 《计算机应用》 CSCD 北大核心 2022年第2期646-654,共9页
针对页岩气储层数据获取困难、标签稀缺、标注成本高昂的问题,提出一种多标准主动查询的多标签学习(MAML)算法。首先,考虑样本的信息性和代表性来对样本进行初步处理;其次,加入包括属性差异性和标签丰富性的样本丰富性约束,在此基础上... 针对页岩气储层数据获取困难、标签稀缺、标注成本高昂的问题,提出一种多标准主动查询的多标签学习(MAML)算法。首先,考虑样本的信息性和代表性来对样本进行初步处理;其次,加入包括属性差异性和标签丰富性的样本丰富性约束,在此基础上选择有价值的样本进行标签查询;最后,利用多标签学习算法来预测剩余样本的标签。通过11个Yahoo数据集上的实验,将MAML算法与流行的多标签学习算法和主动学习算法进行比较,验证了MAML算法的优越性。然后将实验扩展到4个真实的页岩气测井数据集。在该实验中,与多标签学习算法:基于K最近邻的多标签(ML-KNN)学习方法、多标签学习的反向传播(BP-MLL)算法、具有全局和局部标签相关性的多标签学习方法(GLOCAL)和通过查询信息性和代表性样本的主动学习(QUIRE)方法相比,MAML算法在页岩气储层综合品质预测精度均值上分别提升了45个百分点、68个百分点、68个百分点和51个百分点。实验结果充分验证了MAML算法在页岩气储层甜点预测领域的实用性和优越性。 展开更多
关键词 多标签学习 主动学习 多标准优化 查询 甜点预测
下载PDF
基于主动学习的标签噪声清洗方法 被引量:4
20
作者 孟晓超 姜高霞 王文剑 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第2期9-16,共8页
在监督分类学习中,标签噪声对模型有重要的影响;而现有的标签噪声过滤方法一般都是基于模型的预测结果对噪声样本进行检测并去除,当噪声样本较多时,去除噪声样本的同时将会影响原来样本的完整性,使样本信息缺失。针对这一问题,提出一种... 在监督分类学习中,标签噪声对模型有重要的影响;而现有的标签噪声过滤方法一般都是基于模型的预测结果对噪声样本进行检测并去除,当噪声样本较多时,去除噪声样本的同时将会影响原来样本的完整性,使样本信息缺失。针对这一问题,提出一种基于主动学习的标签噪声清洗方法(active label noise cleaning based on classification with gaussian process,GP_ALNC),该方法将高斯过程模型和主动学习相结合,从已有标签样本集中筛选出不确定性最高的样本交给人工专家进行检验,通过这种迭代方法清洗掉大部分噪声数据的同时保持了原有数据的完整性;并针对二分类任务中的标签噪声问题,在MNIST数据集和UCI数据集上,与已有方法ALNR(active label noise removal)以及ICCN_SMO(iterative correction of class noise based on SMO)进行了实验对比,并取得了不错的表现。 展开更多
关键词 标签噪声 噪声清洗 高斯过程 主动学习
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部