期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
Multi-label active learning by model guided distribution matching 被引量:4
1
作者 Nengneng GAO Sheng-Jun HUANG Songcan CHEN 《Frontiers of Computer Science》 SCIE EI CSCD 2016年第5期845-855,共11页
Multi-label learning is an effective framework for learning with objects that have multiple semantic labels, and has been successfully applied into many real-world tasks, In contrast with traditional single-label lear... Multi-label learning is an effective framework for learning with objects that have multiple semantic labels, and has been successfully applied into many real-world tasks, In contrast with traditional single-label learning, the cost of la- beling a multi-label example is rather high, thus it becomes an important task to train an effective multi-label learning model with as few labeled examples as possible. Active learning, which actively selects the most valuable data to query their labels, is the most important approach to reduce labeling cost. In this paper, we propose a novel approach MADM for batch mode multi-label active learning. On one hand, MADM exploits representativeness and diversity in both the feature and label space by matching the distribution between labeled and unlabeled data. On the other hand, it tends to query predicted positive instances, which are expected to be more informative than negative ones. Experiments on benchmark datasets demonstrate that the proposed approach can reduce the labeling cost significantly. 展开更多
关键词 multi-label learning batch mode active learning distribution matching
原文传递
点云场景语义标注的排序批处理模式主动学习法
2
作者 邹禄杰 花向红 +2 位作者 赵不钒 陶武勇 李琪琪 《测绘学报》 EI CSCD 北大核心 2023年第2期260-271,共12页
针对点云场景语义标注存在着手工标注费时费力、算法耗时严重、标注精度不高和不适用于大规模场景点云处理等问题,本文提出了一种结合排序批处理模式的主动学习点云场景语义标注方法。该方法首先对原始点云进行下采样处理,然后利用改进... 针对点云场景语义标注存在着手工标注费时费力、算法耗时严重、标注精度不高和不适用于大规模场景点云处理等问题,本文提出了一种结合排序批处理模式的主动学习点云场景语义标注方法。该方法首先对原始点云进行下采样处理,然后利用改进的递归特征增加法从庞大的特征集中筛选出最优特征子集,采用排序批处理模式采样算法迭代选取并人工标注少数未标注点,通过创建最小人工标注训练集来完成下采样点云的语义标注工作,最后利用邻域等权标签传播算法完成原始点云数据的标注。对3个室外大场景点云分别进行的试验表明:本文方法只需人工标注7.50%、7.35%、5.83%的点云即可完成下采样点云的标注工作。此外,对比试验表明,本文方法在标注精度和减少人工成本方面优于其他方法,能为点云语义标注工作节省大量人工成本。 展开更多
关键词 点云场景 排序批处理模式 特征选择 主动学习 语义标注
下载PDF
临近最优主动学习的藏语语音识别方法研究 被引量:3
3
作者 赵悦 李要嫱 +1 位作者 徐晓娜 吴立成 《计算机工程与应用》 CSCD 北大核心 2018年第22期156-159,215,共5页
语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样... 语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样本交给用户进行标注,以便利用少量高质量的训练样本构建与大数据量训练方式一样精准的识别模型。研究了基于主动学习的藏语拉萨话语音语料选择方法,提出了一种临近最优的批量样本选择目标函数,并验证了其具有submodular函数性质。通过实验验证,该方法能够使用较少的训练数据保证语音识别模型的精度,从而减少了人工标注语料的工作量。 展开更多
关键词 临近最优批量主动学习 submodular函数 语音语料选择 藏语拉萨话语音识别
下载PDF
基于信息密度的病毒分类器批量主动学习方法
4
作者 江山 欧庆于 《海军工程大学学报》 CAS 北大核心 2015年第4期31-35,共5页
针对病毒分类器在实际应用中存在的更新速度慢、对未知病毒检测能力不足等问题,对批量主动学习理论在病毒分类器训练方面的应用进行了研究,提出了一种基于信息密度的病毒分类器批量主动学习方法。该方法从基本询问策略、相似度测量及超... 针对病毒分类器在实际应用中存在的更新速度慢、对未知病毒检测能力不足等问题,对批量主动学习理论在病毒分类器训练方面的应用进行了研究,提出了一种基于信息密度的病毒分类器批量主动学习方法。该方法从基本询问策略、相似度测量及超平面夹角三个方面对待选训练样本的熵信息、信息密度及样本间的差异性进行综合衡量,实现了在一次询问过程中对多个有效新训练样本的选取。实验表明:该方法能够有效地缩减病毒分类器的训练时间,降低对训练数据的数量要求,提高系统的学习效率。 展开更多
关键词 病毒分类器 信息密度 批量主动学习 支持向量机
下载PDF
面向网络结构发现的批量主动学习算法
5
作者 柴变芳 魏春丽 +1 位作者 曹欣雨 王建岭 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第6期1020-1029,共10页
网络结构发现可识别网络多类型聚类模式,但其准确率有待提升.批量主动学习选择质量高的节点集合构造先验,可提升无监督网络结构发现的性能.面向属性网络分类的主动学习BMAL(Batch Mode Active Learning)只考虑链接信息实现网络节点选择... 网络结构发现可识别网络多类型聚类模式,但其准确率有待提升.批量主动学习选择质量高的节点集合构造先验,可提升无监督网络结构发现的性能.面向属性网络分类的主动学习BMAL(Batch Mode Active Learning)只考虑链接信息实现网络节点选择,但不能有效选择使模型性能提升至最优的节点集合,且依赖初始人工标注及参数.提出一个新的批量主动学习算法,利用目标函数的子模性迭代选择最优的节点集合.该方法基于未标记节点的不确定性和非冗余影响力选择最优节点集合,不确定性依据节点及其邻居的类隶属度,影响力依据节点的非重叠中心性,两个指标的权重依据熵权法自动确定.人工和真实网络上的实验结果表明,该方法能选择使结构发现性能提升最大的节点集合. 展开更多
关键词 批量主动学习 节点集合选择 网络结构发现 半监督聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部