期刊文献+
共找到12,439篇文章
< 1 2 250 >
每页显示 20 50 100
基于深度主动学习与CBAM的细粒度菊花表型识别 被引量:3
1
作者 袁培森 丁毅飞 徐焕良 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期258-267,共10页
针对菊花种类繁多,花型差别细微,准确标注比较困难的问题,基于深度主动学习与混合注意力机制模块(Convolutional block attention module,CBAM),提出了一种标号数据不足情况下的菊花表型智能识别方法和框架。首先,通过主动学习策略基于... 针对菊花种类繁多,花型差别细微,准确标注比较困难的问题,基于深度主动学习与混合注意力机制模块(Convolutional block attention module,CBAM),提出了一种标号数据不足情况下的菊花表型智能识别方法和框架。首先,通过主动学习策略基于最优标号和次优标号法(Best vs second-best,BvSB)在未标记菊花样本中选取信息量较大的样本进行标记,并将标记后的样本放入训练样本中;其次,使用深度卷积神经网络ResNet50作为本文的主干网络训练标记样本,引入混合注意力机制模块CBAM,使模型能够更为准确地提取细粒度图像中的高层语义信息;最后,用更新后的训练样本继续训练分类模型,直到模型达到迭代次数后停止。实验结果表明,该方法在少量菊花标记样本下,精确率、召回率和F1值分别达到93.66%、93.15%和93.41%。本文方法可为标号数据不足情况下的菊花等花卉智能化识别提供技术支撑。 展开更多
关键词 菊花表型 细粒度图像识别 主动学习 ResNet50 注意力机制模块
下载PDF
促进学生主动学习的英语阅读教学:内涵、活动设计要点及思考 被引量:12
2
作者 葛炳芳 《教学月刊(中学版)(外语教学)》 2024年第1期51-57,共7页
培养学生主动学习的能力有助于教会学生学会学习,使学生成为有责任担当的学习者。阅读在培养学生主动学习能力上有天然的优势。教师需要理解英语阅读教学中主动学习的内涵,把握设计促进学生主动学习的英语阅读教学活动的要点。具体教学... 培养学生主动学习的能力有助于教会学生学会学习,使学生成为有责任担当的学习者。阅读在培养学生主动学习能力上有天然的优势。教师需要理解英语阅读教学中主动学习的内涵,把握设计促进学生主动学习的英语阅读教学活动的要点。具体教学中,教师需要融通理解逻辑与“出口任务”,融合学生回应与意义关联,融洽教师角色与学生责任,使学生立足文本解读进行意义的加工、建构,在积极合作互动的学习文化中,变被动学习为主动学习,进而达成深度学习。教师还需要注意以自主提问为培养学生主动学习能力的起点,理解细节梳理、概念化与结构化的关系,并相信师生“改变”之力量。 展开更多
关键词 主动学习 活动设计 英语阅读教学
下载PDF
非平衡数据流在线主动学习方法
3
作者 李艳红 任霖 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第7期1389-1401,共13页
数据流分类是数据流挖掘领域一项重要研究任务,目标是从不断变化的海量数据中捕获变化的类结构.目前,几乎没有框架可以同时处理数据流中常见的多类非平衡、概念漂移、异常点和标记样本成本高昂问题.基于此,提出一种非平衡数据流在线主... 数据流分类是数据流挖掘领域一项重要研究任务,目标是从不断变化的海量数据中捕获变化的类结构.目前,几乎没有框架可以同时处理数据流中常见的多类非平衡、概念漂移、异常点和标记样本成本高昂问题.基于此,提出一种非平衡数据流在线主动学习方法(Online active learning method for imbalanced data stream,OALM-IDS).AdaBoost是一种将多个弱分类器经过迭代生成强分类器的集成分类方法,AdaBoost.M2引入了弱分类器的置信度,此类方法常用于静态数据.定义了基于非平衡比率和自适应遗忘因子的训练样本重要性度量,从而使AdaBoost.M2方法适用于非平衡数据流,提升了非平衡数据流集成分类器的性能.提出了边际阈值矩阵的自适应调整方法,优化了标签请求策略.将概念漂移程度融入模型构建过程中,定义了基于概念漂移指数的自适应遗忘因子,实现了漂移后的模型重构.在6个人工数据流和4个真实数据流上的对比实验表明,提出的非平衡数据流在线主动学习方法的分类性能优于其他5种非平衡数据流学习方法. 展开更多
关键词 主动学习 数据流分类 多类非平衡 概念漂移
下载PDF
非平衡概念漂移数据流主动学习方法
4
作者 李艳红 王甜甜 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第3期589-606,共18页
数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真... 数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真实场景下是不现实的.此外,真实数据流可能表现出较高且不断变化的类不平衡比率,会进一步增加数据流分类任务的复杂性.为此,提出一种非平衡概念漂移数据流主动学习方法 (Active learning method for imbalanced concept drift data stream, ALM-ICDDS).定义基于多预测概率的样本预测确定性度量,提出边缘阈值矩阵的自适应调整方法,使得标签查询策略适用于类别数较多的非平衡数据流;提出基于记忆强度的样本替换策略,将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中,提升新基分类器的分类性能;定义基于分类精度的基分类器重要性评价及更新方法,实现漂移后的集成分类器更新.在7个合成数据流和3个真实数据流上的对比实验表明,提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法. 展开更多
关键词 数据流分类 主动学习 概念漂移 多类不平衡
下载PDF
医学研究生动物实验课教学改革:培养学生主动学习和创新思维的能力
5
作者 苗晋鑫 曹利华 苗明三 《中国比较医学杂志》 CAS 北大核心 2024年第6期100-105,共6页
动物实验课是医学及生命科学相关专业中重要的实践教学环节,对医学类研究生的实验技能、科学思维和创新能力的培养具有重要意义。然而,传统的动物实验课教学方式存在内容单一、研究生参与度不高等问题。为更好地促进研究生主动学习和创... 动物实验课是医学及生命科学相关专业中重要的实践教学环节,对医学类研究生的实验技能、科学思维和创新能力的培养具有重要意义。然而,传统的动物实验课教学方式存在内容单一、研究生参与度不高等问题。为更好地促进研究生主动学习和创新思维的培养,本文旨在探讨动物实验课的教学改革。首先,介绍动物实验课教学改革的背景和意义,强调其对研究生能力培养的重要性。其次,提出动物实验课教学改革的原则,包括以研究生为中心、注重问题解决和实践探索、促进跨学科融合等,同时将中国实验动物福利伦理审查贯穿其中。然后,从课程设计、教学方法、评价方式等方面,详细阐述动物实验课教学改革的具体措施。在课程设计上,应注重选取有挑战性和探索性的实验项目,充分考虑研究生的兴趣和专业需求。在教学方法上,应鼓励研究生主动参与、探索和合作,引导他们进行问题解决和创新思维的培养。在评价方式上,应采用多样化的评价手段,如实验报告、小组讨论和项目展示等,以全面评估研究生的综合能力和创新思维。最后,通过实践验证和效果评估,总结动物实验课教学改革的经验和成果,并提出进一步完善的建议。 展开更多
关键词 动物实验课 教学改革 主动学习 创新思维
下载PDF
结合聚类边界采样的主动学习
6
作者 胡峰 李路正 +1 位作者 代劲 刘群 《智能系统学报》 CSCD 北大核心 2024年第2期482-492,共11页
主动学习是一种机器学习方法,需要选择最有价值的样本进行标注。目前,主动学习在应用时面临着一些挑战,其依赖分类器的先验假设,这容易导致分类器性能意外下降,同时需要一定规模的样本作为启动条件。聚类可以降低问题规模,是主动学习的... 主动学习是一种机器学习方法,需要选择最有价值的样本进行标注。目前,主动学习在应用时面临着一些挑战,其依赖分类器的先验假设,这容易导致分类器性能意外下降,同时需要一定规模的样本作为启动条件。聚类可以降低问题规模,是主动学习的一种有效手段。为此,结合密度聚类边界采样,开展主动学习方法的研究。针对容易产生分类错误的聚类边界区域,通过计算样本密度,提出一种密度峰值聚类边界点采样方法;在此基础上,给出密度熵的定义,并利用密度熵对聚类边界区域进行启发式搜索,提出一种基于聚类边界采样的主动学习方法。试验结果表明,与文献中的5种主动学习算法相比,该算法能够以更少标记量获得同等甚至更高的分类性能,是一种有效的主动学习算法;在标记不足,无标签样本总量20%的情况下,算法在Accuracy、F-score等指标上取得较好的结果。 展开更多
关键词 主动学习 机器学习 聚类边界 密度峰值聚类 几何采样 信息熵 版本空间 主动聚类
下载PDF
主动学习法的“智能产品造型设计”课程教学探索
7
作者 王旭 《机电技术》 2024年第1期106-108,共3页
为促进学生在实践动手、创新以及团队协作等方面能力的显著提升,在对课程“智能产品造型设计”的教学改革研究中,选择CDIO工程教育模式为教学理念,根据其实施标准中的主动学习法开展教学实践。通过分析该课程的特点,采取以项目为基础,... 为促进学生在实践动手、创新以及团队协作等方面能力的显著提升,在对课程“智能产品造型设计”的教学改革研究中,选择CDIO工程教育模式为教学理念,根据其实施标准中的主动学习法开展教学实践。通过分析该课程的特点,采取以项目为基础,在课堂上开展学生学习活动的主动学习模式,具体实现方式包括构思、设计、翻转课堂、辩论以及团队协作等。从教学实践情况来看,无论是学生的创意作品数量、作品专利授权率以及科技竞赛获奖率等方面,均有较大的提升。从该教学改革的研究结果来看,主动学习模式对于提升课程的教学质量,具有比较良好的效果。 展开更多
关键词 主动学习 智能产品造型设计 教学探索 CDIO 教学实践
下载PDF
基于深度主动学习的科研合作网络中节点排序研究
8
作者 刘臣 宋雪 《软件导刊》 2024年第4期186-192,共7页
节点排序任务在社交网络与科研合作等领域的应用愈加广泛,准确评估网络节点重要性的课题备受关注。然而,合作网络通常存在大量噪声、不完整信息以及动态变化,传统节点排序方法往往难以取得令人满意的结果。为此,提出一种基于深度主动学... 节点排序任务在社交网络与科研合作等领域的应用愈加广泛,准确评估网络节点重要性的课题备受关注。然而,合作网络通常存在大量噪声、不完整信息以及动态变化,传统节点排序方法往往难以取得令人满意的结果。为此,提出一种基于深度主动学习的方法进行科研合作网络中节点的排序。该方法结合深度学习的优势以及主动学习的查询策略,能够在数据标签稀缺和噪声干扰较大的情况下自适应地根据网络中节点的重要性进行排序。具体而言,首先利用深度学习模型从节点的多模态特征中进行表示学习,将节点表示与其重要性相结合,形成一个综合排序指标;然后通过主动学习方法选择对排序结果具有较大影响的节点进行标注,从而逐步优化排序模型。在真实的科研合作网络数据集上进行验证实验,发现与传统排序方法相比,基于深度主动学习的方法在节点排序准确性和稳定性方面有显著提升。 展开更多
关键词 科研合作网络 深度主动学习 学习排序 置信度
下载PDF
一种基于主动学习的开放集图像识别方法
9
作者 王慧敏 王智强 +1 位作者 郭婷 梁吉业 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2442-2448,共7页
开放集识别(Open Set Recognition,OSR)的主要目的是识别未标记数据中的新类样本,同时对已见类样本进行正确分类.现有的大多数识别方法对未标记数据的评估和伪标记信息的利用不足.本文提出一种基于主动学习的开放集图像识别方法(Open Se... 开放集识别(Open Set Recognition,OSR)的主要目的是识别未标记数据中的新类样本,同时对已见类样本进行正确分类.现有的大多数识别方法对未标记数据的评估和伪标记信息的利用不足.本文提出一种基于主动学习的开放集图像识别方法(Open Set Image Recognition Method Based on Active Learning,AC-OSIR),充分利用未标记数据提升开放集识别性能.通过引入已见类别的语义知识,构建语义知识和图像特征的映射关系.对于未标记数据,利用阈值选择策略区分开放集样本和已见类样本,通过主动学习模型迭代地识别高置信度开放集样本和已见类样本,并将高置信度已见类样本添加到标记数据集中.本文在图像分类数据集CIFAR-10、TIN和LSUN,以及两个合成数据集的实验结果表明了基于主动学习的开放集图像识别方法的有效性. 展开更多
关键词 开放集识别 语义知识 主动学习 阈值选择 图像识别
下载PDF
基于多模态知识主动学习的视频问答方案
10
作者 刘明阳 王若梅 +1 位作者 周凡 林格 《计算机研究与发展》 EI CSCD 北大核心 2024年第4期889-902,共14页
视频问答是人工智能领域的一个热点研究问题.现有方法在特征提取方面缺乏针对视觉目标运动细节的获取,从而会导致错误因果关系的建立.此外,在数据融合与推理过程中,现有方法缺乏有效的主动学习能力,难以获取特征提取之外的先验知识,影... 视频问答是人工智能领域的一个热点研究问题.现有方法在特征提取方面缺乏针对视觉目标运动细节的获取,从而会导致错误因果关系的建立.此外,在数据融合与推理过程中,现有方法缺乏有效的主动学习能力,难以获取特征提取之外的先验知识,影响了模型对多模态内容的深度理解.针对这些问题,首先,设计了一种显性多模态特征提取模块,通过获取图像序列中视觉目标的语义关联以及与周围环境的动态关系来建立每个视觉目标的运动轨迹.进一步通过动态内容对静态内容的补充,为数据融合与推理提供了更加精准的视频特征表达.其次,提出了知识自增强多模态数据融合与推理模型,实现了多模态信息理解的自我完善和逻辑思维聚焦,增强了对多模态特征的深度理解,减少了对先验知识的依赖.最后,提出了一种基于多模态知识主动学习的视频问答方案.实验结果表明,该方案的性能优于现有最先进的视频问答算法,大量的消融和可视化实验也验证了方案的合理性. 展开更多
关键词 视频问答 数据融合与推理 多模态主动学习 视频细节描述提取 深度学习
下载PDF
基于主动学习的深度半监督聚类模型
11
作者 付艳艳 黄瑞章 +3 位作者 薛菁菁 任丽娜 陈艳平 林川 《计算机应用研究》 CSCD 北大核心 2024年第10期2955-2961,共7页
深度半监督聚类旨在利用少量的监督信息达到更好的聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深... 深度半监督聚类旨在利用少量的监督信息达到更好的聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深度半监督聚类模型(DASCM)。该模型设计了一种主动学习方法,能够挑选出蕴涵丰富信息的边缘文本,并进一步生成蕴涵边缘文本的高价值监督信息。该模型利用这些监督信息指导聚类,从而提升聚类性能。在5个真实文本数据集上的实验表明,DASCM的聚类性能有显著提升。这一结果验证了利用主动学习方法生成的涵盖边缘文本的监督信息对于提升聚类效果是有效的。 展开更多
关键词 深度半监督聚类 主动学习 边缘文本
下载PDF
天气数据驱动下基于深度主动学习的新型电力系统供需失衡风险快速评估方法
12
作者 王邦彦 皮俊波 +7 位作者 王秀丽 齐世雄 孙文多 黄启航 魏成骁 张小平 徐新然 王志维 《电网技术》 EI CSCD 北大核心 2024年第10期4050-4059,I0034,共11页
相较于极端气象,天气因素对电力系统供需平衡的冲击常被忽视,但多日无风无光等事件同样可带来保供问题。提出了一种天气数据赋能、深度主动学习赋智的新型电力系统供需失衡风险快速评估方法,较传统方法更高效、更准确。首先,考虑源网荷... 相较于极端气象,天气因素对电力系统供需平衡的冲击常被忽视,但多日无风无光等事件同样可带来保供问题。提出了一种天气数据赋能、深度主动学习赋智的新型电力系统供需失衡风险快速评估方法,较传统方法更高效、更准确。首先,考虑源网荷储多环节建立以天为尺度的电力系统生产模拟模型,以进行无风无光等异常气象下系统供需失衡的分析。同时,针对传统可靠性指标的不足,提出以天为尺度的新型分布式指标,并进一步利用风险曲线描述系统长期风险。然后,提出应用深度主动学习的电力系统风险快速评估框架,建立风险预测主网络和误差预测副网络耦合的双深度神经网络,并构建相应的损失函数和训练流程。最后,基于IEEE标准算例进行了效果验证与各方法对比,结果验证了其高效、准确、可拓展等特点。该研究为新型电力系统的风险快速评估提出了一种新颖有效的思路。 展开更多
关键词 新型电力系统 天气因素 电力电量平衡 风险评估 深度主动学习
下载PDF
证据理论框架下主动学习代理模型驱动的CFD模拟不确定性量化方法
13
作者 陈浩 吴沐宸 +3 位作者 陈江涛 夏侯唐凡 赵忠锐 刘宇 《空气动力学学报》 CSCD 北大核心 2024年第9期86-99,I0002,共15页
计算流体力学(CFD)模拟中存在模型参数、数值离散和边界条件等诸多形式各异的不确定因素。鉴于证据理论具有灵活的建模框架,且能同时量化CFD模拟中的随机和认知不确定性,基于其提出了一种证据理论框架下主动学习代理模型驱动的CFD模拟... 计算流体力学(CFD)模拟中存在模型参数、数值离散和边界条件等诸多形式各异的不确定因素。鉴于证据理论具有灵活的建模框架,且能同时量化CFD模拟中的随机和认知不确定性,基于其提出了一种证据理论框架下主动学习代理模型驱动的CFD模拟不确定性量化方法,以较少的CFD仿真模型调用次数实现对CFD模拟结果的不确定性量化。该方法采用最优最大最小距离策略生成空间分布良好的候选样本点,通过动态熵权-TOPSIS主动学习策略平衡了代理模型的全局探索、局部开发和鲁棒性。此外,提出基于Hartley测度和Jousselme距离的复合收敛准则以判断终止代理模型训练的时间并量化输出响应的不确定性。最后,以采用NASA SC(2)0410翼型剖面的超临界机翼流场CFD模拟为例,分析来流参数和湍流模型参数的不确定性对机翼输出响应升阻比的不确定性量化结果。 展开更多
关键词 CFD 不确定性量化 证据理论 主动学习 代理模型 动态熵权-TOPSIS
下载PDF
基于特征表达和模型预测的主动学习
14
作者 姜海涛 邱保志 李向丽 《计算机工程与设计》 北大核心 2024年第9期2757-2763,共7页
为解决当前的主动学习算法在采样时通常忽略样本特征表达信息的问题,提出一个基于样本特征表达和模型预测的主动学习模型。针对主动学习算法在模型训练早期阶段引起的冷启动问题,提出一个标注集初始化算法。利用聚类技术提取样本特征表... 为解决当前的主动学习算法在采样时通常忽略样本特征表达信息的问题,提出一个基于样本特征表达和模型预测的主动学习模型。针对主动学习算法在模型训练早期阶段引起的冷启动问题,提出一个标注集初始化算法。利用聚类技术提取样本特征表达信息,通过分类器得到样本的模型预测信息,致力于使初始标注集的样本分布尽可能接近原始数据集的分布。实验结果表明,该模型分类准确率优于多个主动学习基线算法,该算法能够有效缓解模型的冷启动问题。 展开更多
关键词 主动学习 特征表达 模型预测 冷启动 聚类 图像分类 标注集初始化
下载PDF
面向可解释性的软件缺陷预测主动学习方法
15
作者 王越 李勇 张文静 《现代电子技术》 北大核心 2024年第20期101-108,共8页
针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本... 针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本放入源项目中以训练预测器。其次,利用领域知识对选定样本进行扰动,构建局部数据集,并通过线性模型在该数据集上模拟数据选择策略的行为,以实现模型的可解释性。实验结果显示:该方法在数据标注方面的指标性能要优于传统的主动学习基准方法;同时,在可解释性方面,该方法的RMSE指标也均低于LIME、全局代理模型以及RuleFit,能较好地解释“黑盒”模型。该方法不仅可以有效提高软件缺陷数据的标注效率,还可以实现模型的可解释性。 展开更多
关键词 软件缺陷预测 主动学习 可解释性 数据标注 数据选择策略 深度学习
下载PDF
基于主动学习和持续学习的同义词挖掘模型
16
作者 潘桢皓 关东海 +1 位作者 袁伟伟 郭然 《计算机应用》 CSCD 北大核心 2024年第S01期18-23,共6页
要提升同义词挖掘的效果通常需要现成的相关领域同义词库的支持。由于相关领域同义词库极其稀缺,给模型优化带来了阻碍。针对缺少相关领域同义词库而导致模型在相关领域的同义词挖掘效果难以持续提升的问题,提出了基于主动学习和持续学... 要提升同义词挖掘的效果通常需要现成的相关领域同义词库的支持。由于相关领域同义词库极其稀缺,给模型优化带来了阻碍。针对缺少相关领域同义词库而导致模型在相关领域的同义词挖掘效果难以持续提升的问题,提出了基于主动学习和持续学习的同义词挖掘模型(SYN-AC)。首先,基于主动学习的方法获取专家标记数据,设计了一个新的损失函数并利用标记后的数据去微调模型;其次,为了减少时间和空间消耗,采用了持续学习的方法,使模型在只使用当前组标记的数据进行训练的情况下,也能不断提高同义词挖掘效果,而不需要每次都使用所有标记数据对模型重新微调。使用了3个数据集模拟专家标记的过程,实验结果表明,在其中2个数据集上比效果最好的BERT(Bidirectional Encoder Representations from Transformers)模型F1值分别提升了9.34个百分点和2.75个百分点。验证了SYN-AC能够有效提高同义词挖掘的效果。 展开更多
关键词 同义词挖掘 主动学习 持续学习 BERT 余弦相似度
下载PDF
基于主动学习和二次有理核的模型无关局部解释方法
17
作者 周晟昊 袁伟伟 关东海 《计算机科学》 CSCD 北大核心 2024年第2期245-251,共7页
深度学习模型的广泛使用,在更大程度上使人们意识到模型的决策是亟需解决的问题,复杂难以解释的黑盒模型阻碍了算法在实际场景中部署。LIME作为最流行的局部解释方法,生成的扰动数据却具有不稳定性,导致最终的解释产生偏差。针对上述问... 深度学习模型的广泛使用,在更大程度上使人们意识到模型的决策是亟需解决的问题,复杂难以解释的黑盒模型阻碍了算法在实际场景中部署。LIME作为最流行的局部解释方法,生成的扰动数据却具有不稳定性,导致最终的解释产生偏差。针对上述问题,提出了一种基于主动学习和二次有理核的模型无关局部解释方法ActiveLIME,使得局部解释模型更加忠于原始分类器。ActiveLIME生成扰动数据后,通过主动学习的查询策略对扰动数据进行采样,筛选不确定性高的扰动集训练,使用迭代过程中准确度最高的局部模型对感兴趣实例生成解释。并且,针对容易陷入局部过拟合的高维稀疏样本,在模型损失函数中引入了二次有理核来减少过拟合。实验结果表明,所提出的ActiveLIME方法引比传统局部解释方法具有更高的局部保真度和解释质量。 展开更多
关键词 局部解释 扰动采样 主动学习查询策略 二次有理核
下载PDF
局部一致性主动学习的源域无关开集域自适应
18
作者 王帆 韩忠义 +1 位作者 苏皖 尹义龙 《软件学报》 EI CSCD 北大核心 2024年第4期1651-1666,共16页
无监督域自适应在解决训练集(源域)和测试集(目标域)分布不一致的问题上已经取得了一定的成功.在面向低能耗场景和开放动态任务环境时,在资源约束和开放类别出现的情况下,现有的无监督域自适应方法面临着严峻的挑战.源域无关开集域自适... 无监督域自适应在解决训练集(源域)和测试集(目标域)分布不一致的问题上已经取得了一定的成功.在面向低能耗场景和开放动态任务环境时,在资源约束和开放类别出现的情况下,现有的无监督域自适应方法面临着严峻的挑战.源域无关开集域自适应(SF-ODA)旨在将源域模型中的知识迁移到开放类出现的无标签目标域,从而在无源域数据资源的限制下辨别公共类和检测开放类.现有的源域无关开集域自适应的方法聚焦于设计准确检测开放类别的源域模型或增改模型的结构.但是,这些方法不仅需要额外的存储空间和训练开销,而且在严格的隐私保护场景下难以实现.提出了一个更加实际的场景:主动学习的源域无关开集域自适应(ASF-ODA),目标是基于一个普通训练的源域模型和少量专家标注的有价值的目标域样本来实现鲁棒的迁移.为了达成此目标,提出了局部一致性主动学习(LCAL)算法.首先,利用目标域中局部特征标签一致的特点,LCAL设计了一种新的主动选择方法:局部多样性选择,来挑选更有价值的阈值模糊样本来促进开放类和公共类分离.接着,LCAL基于信息熵初步筛选出潜在的公共类集合和开放类集合,并利用第一步得到的主动标注样本对这两个集合进行匹配纠正,得到两个对应的可信集合.最后,LCAL引入开集损失和信息最大化损失来进一步促使公共类和开放类分离,引入交叉熵损失来实现公共类的辨别.在Office-31、Office-Home和VisDA-C这3个公开的基准数据集上的大量实验表明:在少量有价值的目标域样本的帮助下,LCAL不仅显著优于现有的源域无关开集域自适应方法,还大幅度超过了现有的主动学习方法的表现,在某些迁移任务上可以提升20%. 展开更多
关键词 资源约束 开集识别 源域无关域自适应 开集域自适应 主动学习
下载PDF
基于自适应密度聚类的多准则主动学习方法
19
作者 贺忠海 朱温涵 +1 位作者 陈旭旺 张晓芳 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第3期179-187,共9页
主动学习能够以更少的标注成本训练出更好的机器学习模型。现有的RD算法与QBC算法的结合有效地解决了只考虑单一标准的问题。然而,RD所基于的K-means聚类会将离群点也包括在内进而造成模型性能降低,而QBC则需要维护于多个模型而间接返... 主动学习能够以更少的标注成本训练出更好的机器学习模型。现有的RD算法与QBC算法的结合有效地解决了只考虑单一标准的问题。然而,RD所基于的K-means聚类会将离群点也包括在内进而造成模型性能降低,而QBC则需要维护于多个模型而间接返回样本的信息性.针对上述问题,本文提出了一种基于自适应密度聚类的高斯过程回归(ADC-GPR)算法,通过先聚类后直接利用不确定性进而高效选择样本。该算法中的ADC聚类不仅对离群点鲁棒,还能根据数据集分布特性自适应聚类,并为后续的AL提供了代表性样本点和其对应的簇,该方法在无监督选择时保证了代表性和多样性,在有监督选择时考虑了信息性、代表性和多样性。实验结果表明,在相同的抽样次数下将ADC-GPR算法与RS、KS以及RD-GPR算法相比,其平均性能分别提升了37.3%、8%和2.8%,ADC-GPR算法的选择效率更高。 展开更多
关键词 主动学习 自适应密度聚类 高斯过程回归 离群点鲁棒 多标准融合
下载PDF
基于主动学习与贝叶斯深度神经网络的高维多输出不确定性传播方法
20
作者 刘竟飞 姜潮 +1 位作者 倪冰雨 汪宗太 《中国机械工程》 EI CAS CSCD 北大核心 2024年第5期792-801,共10页
针对实际工程中存在的具有多个输出响应的高维问题,提出一种基于主动学习与贝叶斯深度神经网络的高维多输出不确定性传播方法。利用多个输出响应对应同一组输入变量的特点,对输入变量进行一次性采样,从而构造初始训练样本集。采用贝叶... 针对实际工程中存在的具有多个输出响应的高维问题,提出一种基于主动学习与贝叶斯深度神经网络的高维多输出不确定性传播方法。利用多个输出响应对应同一组输入变量的特点,对输入变量进行一次性采样,从而构造初始训练样本集。采用贝叶斯深度神经网络初步构建高维多输出问题的代理模型。贝叶斯深度神经网络能够同时求解多个预测输出响应的不确定性估计,基于该特点发展了一种针对高维多输出问题的主动加点策略,通过主动学习的方式进一步构建具有较高精度的高维多输出代理模型。然后,利用蒙特卡罗采样方法以及高斯混合模型求解多个输出响应的联合概率密度函数。研究结果表明,所提方法不仅能够避免分别对多个输出响应进行独立求解的复杂过程,而且能够利用多个输出响应之间的关联,主动筛选关键样本点进行建模,在一定程度上提高了高维多输出问题的求解效率。最后,通过几个数值算例验证了所提方法的有效性。 展开更多
关键词 主动学习 贝叶斯深度神经网络 高维不确定性 多输出问题
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部