期刊文献+
共找到122篇文章
< 1 2 7 >
每页显示 20 50 100
增强提示学习的少样本文本分类方法 被引量:2
1
作者 李睿凡 魏志宇 +2 位作者 范元涛 叶书勤 张光卫 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期1-12,共12页
针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中... 针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中含有的类别信息,采用三元组损失联合优化方法,并引入掩码语言模型任务作为正则项,提升模型的泛化能力。在公开的4个中文文本和3个英文文本分类数据集上进行实验评估,结果表明EPL4FTC方法的准确度明显优于所对比的基线方法。 展开更多
关键词 预训练语言模型 样本学习 文本分类 提示学习 三元组损失
下载PDF
基于元学习的图卷积网络少样本学习模型 被引量:1
2
作者 刘鑫磊 冯林 +3 位作者 廖凌湘 龚勋 苏菡 王俊 《电子学报》 EI CAS CSCD 北大核心 2024年第3期885-897,共13页
少样本学习是目前机器学习研究领域的热点和难点.针对现有的少样本学习模型不能有效捕捉数据特征与数据标签之间的联系,造成分类模型泛化能力弱的问题,提出一种基于元学习的原型空间图卷积网络少样本学习模型FSL-GCNPS(Few-Shot Learnin... 少样本学习是目前机器学习研究领域的热点和难点.针对现有的少样本学习模型不能有效捕捉数据特征与数据标签之间的联系,造成分类模型泛化能力弱的问题,提出一种基于元学习的原型空间图卷积网络少样本学习模型FSL-GCNPS(Few-Shot Learning of Graph Convolutional Network on Prototype Space).首先,利用卷积神经网络提取多任务数据的特征向量;其次,为了将特征向量映射到原型空间中,根据元学习的训练策略得到特征向量的类原型表达;然后,通过类原型向量和类向量之间的嵌入表示,构建图结构数据,并进行图卷积网络训练、推理.实验结果表明,相较于经典少样本学习方法,FSL-GCNPS模型拥有更好的分类准确率和分类稳定性.同时,在医学图像领域数据集上实验表明,FSL-GCNPS具有很好的跨域适应性. 展开更多
关键词 学习 图卷积网络 卷积神经网络 样本学习 原型空间
下载PDF
少样本下基于元学习的柱塞泵故障诊断方法 被引量:1
3
作者 胡宏俊 杨喜旺 黄晋英 《中北大学学报(自然科学版)》 CAS 2024年第5期592-600,共9页
针对柱塞泵故障样本少、在噪声干扰下故障信号微弱及传统深度学习依赖大量训练样本的问题,提出了一种基于模型不可知元学习(MAML)的少样本柱塞泵故障诊断方法。首先,利用改进的带自适应噪声的完全集成经验模态分解(ICEEMDAN)方法来分解... 针对柱塞泵故障样本少、在噪声干扰下故障信号微弱及传统深度学习依赖大量训练样本的问题,提出了一种基于模型不可知元学习(MAML)的少样本柱塞泵故障诊断方法。首先,利用改进的带自适应噪声的完全集成经验模态分解(ICEEMDAN)方法来分解采集到的一维振动信号,得到本征模态函数的IMF分量,并筛选故障信息丰富的敏感分量以增强振动信号中的特征信息。其次,建立了多通道一维卷积模型,该模型构建了一个具有高效通道注意力机制的通道交互特征编码器,旨在关注不同通道间的交互故障信息,进而有效地提取多个诊断元任务的通用诊断知识。最后,将一维卷积模型作为基模型,并通过MAML方法训练获得了最优的模型初始化参数;最优的初始化模型能够快速适应新工况下的少量柱塞泵故障样本,从而实现了少样本下的柱塞泵故障诊断。利用柱塞泵实验数据验证了模型的性能,结果表明,所提方法在少样本条件下对于各种诊断任务的诊断准确率都达到90%以上。 展开更多
关键词 模型不可知元学习 样本 注意力机制 柱塞泵
下载PDF
基于两阶段网络和提示学习的少样本中文命名实体识别
4
作者 李准 宋媚 祝义 《南京邮电大学学报(自然科学版)》 北大核心 2024年第5期87-94,共8页
基于提示学习的方法在处理少样本句子级分类任务时效果较好,然而在处理字符级的命名实体识别任务时,现有采用枚举手动构建提示模板的方法效率低下且性能不稳定。针对此问题,提出基于两阶段网络和提示学习的少样本中文命名实体识别方法... 基于提示学习的方法在处理少样本句子级分类任务时效果较好,然而在处理字符级的命名实体识别任务时,现有采用枚举手动构建提示模板的方法效率低下且性能不稳定。针对此问题,提出基于两阶段网络和提示学习的少样本中文命名实体识别方法。第一阶段网络,创新性地引入文本生成模型T5,利用提示学习的思想,将文本生成任务改造为完形填空的形式以自动生成提示模板;第二阶段网络,使用当前主流的BERT-BiLSTM-CRF网络架构进行训练。通过消融实验,探讨了提示模板更合理的嵌入方式,在Weibo、Resume和MSRA语料库上的实验结果F1值分别达到了73.58%、96.63%和95.67%,在多组对比实验中效果均为最优,表明了该方法可有效提升少样本中文命名实体识别的效果。 展开更多
关键词 深度学习 命名实体识别 大语言模型 提示学习 文本生成 样本
下载PDF
基于少样本学习的书籍装帧手写字体生成
5
作者 王志敏 朱磊 张媛 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第4期46-55,共10页
手写字体具有一定的亲和度,尤其在书籍装帧设计中更具人性化和表达力,但手工设计字体流程烦琐且专业程度要求高。通过基于人工智能的手写字体生成算法帮助设计是解决这一问题的有效途径。本研究采用少样本字体生成网络,其中在特征提取... 手写字体具有一定的亲和度,尤其在书籍装帧设计中更具人性化和表达力,但手工设计字体流程烦琐且专业程度要求高。通过基于人工智能的手写字体生成算法帮助设计是解决这一问题的有效途径。本研究采用少样本字体生成网络,其中在特征提取方面采用了多子编码器提取了多个特征,可更好地捕捉不同的局部概念;在样本训练方面采用端到端的训练方法,可以显著减少训练时间,提高字体生成效率。采用定性与定量分析相结合的方式,对多种字体生成方法进行了深入比较。相较于其他方法,本研究所提出方法的FID与LPIPS值更低,这充分证明了本研究方法在生成效果上的优越性,生成的字体更加清晰且高度逼真。该方法为书籍装帧设计提供了更快、更有效的解决方案,简化了字体设计的烦琐过程,提升了设计效率。未来的研究可进一步优化生成字体的质量和多样性,以满足不同书籍装帧设计的需求。 展开更多
关键词 生成式对抗网络 样本学习 字体生成 端到端学习
下载PDF
基于元学习的少样本水闸图像识别方法研究 被引量:1
6
作者 薛凌峰 宋炜 +2 位作者 鲍建腾 焦野 戚荣志 《江苏水利》 2024年第3期20-24,共5页
针对实际工程环境中采集的水闸图像样本不均衡、前后景混融导致的识别效果不好的问题,提出一种基于元学习的少样本水闸图像识别方法。首先构建水闸图像数据集,并使用图像增强和预处理对数据集进行优化;再使用多头注意力,提升网络准确捕... 针对实际工程环境中采集的水闸图像样本不均衡、前后景混融导致的识别效果不好的问题,提出一种基于元学习的少样本水闸图像识别方法。首先构建水闸图像数据集,并使用图像增强和预处理对数据集进行优化;再使用多头注意力,提升网络准确捕捉多种与任务相关的关键特征信息的能力,更好地与时序卷积协作,进一步提高水闸图像的识别效果。在构建的sluice-ImageNet数据集上进行实验,实验结果表明,相比其他方法,所提方法在水闸启闭状态图像识别任务上更具有效性和优越性。该方法部署于重点水利工程视频监测平台,辅助人工监管,可实现对水闸异常运行情况的实时监测,为防汛决策提供智能化支持。 展开更多
关键词 图像识别 样本 学习 多头注意力
下载PDF
基于少样本深度学习的异常检测方法:综述与展望
7
作者 赵海燕 陈子盟 +1 位作者 曹健 陈庆奎 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2514-2521,共8页
随着深度学习技术的迅猛发展和广泛应用,需要进行异常检测的场景也越来越多.然而,在对深度神经网络进行训练时,现有的数据集往往不足够支撑模型进行有效的训练,应用少样本学习进行异常检测获得了广泛的关注.本文首先对异常检测问题进行... 随着深度学习技术的迅猛发展和广泛应用,需要进行异常检测的场景也越来越多.然而,在对深度神经网络进行训练时,现有的数据集往往不足够支撑模型进行有效的训练,应用少样本学习进行异常检测获得了广泛的关注.本文首先对异常检测问题进行了说明,对少样本学习进行异常检测进行了定义;其次,本文系统的总结了基于少样本学习进行异常检测的方法,对基于少样本学习进行异常检测从两个角度进行了分类,总结了评价指标,介绍了常用的数据集;最后,本文对少样本学习异常检测的未来进行了展望,提出了研究方向和思路. 展开更多
关键词 深度学习 样本学习 异常检测
下载PDF
基于少样本学习算法的结直肠粘膜下肿瘤和息肉内镜图像分类系统
8
作者 伍亚辉 朱世祺 +2 位作者 吴宇东 张儒发 朱锦舟 《中国医学物理学杂志》 CSCD 2024年第7期897-904,共8页
目的:为解决难以收集足够结直肠粘膜下肿瘤样本训练深度学习模型的问题,基于少样本学习算法构建了粘膜下肿瘤和息肉内镜图像分类模型。方法:收集多中心来源的结直肠粘膜下肿瘤内镜图像共172张,包括结直肠脂肪瘤(CRLs)、神经内分泌肿瘤(N... 目的:为解决难以收集足够结直肠粘膜下肿瘤样本训练深度学习模型的问题,基于少样本学习算法构建了粘膜下肿瘤和息肉内镜图像分类模型。方法:收集多中心来源的结直肠粘膜下肿瘤内镜图像共172张,包括结直肠脂肪瘤(CRLs)、神经内分泌肿瘤(NETs)、锯齿状病变及息肉、传统腺瘤各43张。基于这些内镜图像构建支持集和查询集,在ImageNet和食管内镜图像上二次预训练的ResNet50提取图像特征,计算欧氏距离,使用K近邻算法进行分类。与原始模型和低、高年资内镜医师进行对比,评估少样本学习模型的分类性能。结果:提出的少样本学习模型分类准确率、宏曲线下面积和MacroF1值分别为0.831、0.925和0.831,诊断CRLs的准确率和F1值分别为0.925和0.850,诊断NETs的准确率和F1值分别为0.906和0.805。同时,该模型具有较好的分类一致性(Kappa=0.775)和可解释性。结论:构建的少样本学习模型在区分CRLs、NETs、锯齿状病变及息肉、传统腺瘤内镜图像上表现出优异性能,可用于辅助内镜下识别结直肠粘膜下肿瘤。 展开更多
关键词 样本学习 结直肠粘膜下肿瘤 结直肠息肉 消化内镜图像 深度学习
下载PDF
多模态交叉解耦的少样本学习方法
9
作者 冀中 王思迪 于云龙 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第1期12-21,共10页
当前的多模态少样本学习方法忽视了属性间差异对正确识别样本类别的影响。针对这一问题,提出一种利用多模态交叉解耦的方法,通过解耦不同属性语义特征,并经过特征重建学习样本的本质类别特征,缓解类别属性差异对类别判别的影响。在两个... 当前的多模态少样本学习方法忽视了属性间差异对正确识别样本类别的影响。针对这一问题,提出一种利用多模态交叉解耦的方法,通过解耦不同属性语义特征,并经过特征重建学习样本的本质类别特征,缓解类别属性差异对类别判别的影响。在两个属性差异较大的基准少样本数据集MIT-States和C-GQA上进行的大量实验表明,所提方法较现有方法有较大的性能提升,充分验证了方法的有效性,表明多模态交叉解耦的少样本学习方法能够提升识别少量测试样本的分类性能。 展开更多
关键词 样本学习 多模态学习 特征解耦 属性
下载PDF
基于少样本学习和知识迁移的继电保护压板状态识别
10
作者 赵明 石恒初 +1 位作者 杨远航 成浩天 《电子器件》 CAS 2024年第1期227-231,共5页
针对变电站中保护压板开关状态自动识别问题,提出了一种基于少样本学习和知识迁移的压板开关状态识别模型,使用残差网络提取图像特征,基于度量方法计算查询图像与支持图像之间的相似度,在此基础上使用KNN实现压板开关状态的分类识别。... 针对变电站中保护压板开关状态自动识别问题,提出了一种基于少样本学习和知识迁移的压板开关状态识别模型,使用残差网络提取图像特征,基于度量方法计算查询图像与支持图像之间的相似度,在此基础上使用KNN实现压板开关状态的分类识别。将残差网络在公用数据集上预训练的模型直接迁移到基于少样本学习的压板开关状态的识别任务,并研究了KNN算法中不同的最近邻个数对压板开关状态分类结果的影响。所提方法可在图像样本少的情况下实现压板开关状态的识别。实验结果表明,在支持图像的样本数为30时,图像识别精度达到99.49%。相比于其他大样本的分类方法,所提出的利用少量样本的分类方法能够实现令人满意的分类效果,提高了图像分类的效率。 展开更多
关键词 样本学习 知识迁移 压板状态识别
下载PDF
基于YOLOv5和少样本学习的高空作业安全带检测
11
作者 石彦鹏 潘作为 成浩天 《电子器件》 CAS 2024年第1期215-220,共6页
针对电厂高空作业人员安全带佩戴检测问题,现有研究大多利用深度检测模型直接检测,不仅需要大量样本训练模型,而且由于高空作业背景杂乱、人员目标小,导致不易检测等。为此,提出一种基于目标检测和少样本细粒度分类的两阶段检测方法:首... 针对电厂高空作业人员安全带佩戴检测问题,现有研究大多利用深度检测模型直接检测,不仅需要大量样本训练模型,而且由于高空作业背景杂乱、人员目标小,导致不易检测等。为此,提出一种基于目标检测和少样本细粒度分类的两阶段检测方法:首先利用YOLOv5检测视频图像中的高空作业人员,再用少样本细粒度分类方法识别其是否佩戴安全带。针对佩戴和不佩戴安全带人员的细微差别,设计了一种基于局部描述符的少样本度量学习模型,在公用数据集预训练模型基础上,利用少量训练样本对模型微调,用于安全带佩戴识别。实验结果表明,在支持集图像数为60时,识别精度达到了97.86%。所提方法可实现少样本情况下对高空作业人员安全带佩戴情况的精确检测。 展开更多
关键词 样本学习 局部描述符 YOLOv5 安全带检测 高空作业
下载PDF
基于对比学习及背景挖掘的少样本语义分割
12
作者 王善杰 《计算机系统应用》 2024年第9期261-268,共8页
少样本语义分割是在具有少量标注样本的查询图像的条件下,对潜在对象类别进行分割的计算机视觉任务.然而,现有方法仍然存在两个问题,这对它们构成了挑战.首先是原型偏差问题,这导致原型具有较少的前景目标信息,难以模拟真实的类别统计信... 少样本语义分割是在具有少量标注样本的查询图像的条件下,对潜在对象类别进行分割的计算机视觉任务.然而,现有方法仍然存在两个问题,这对它们构成了挑战.首先是原型偏差问题,这导致原型具有较少的前景目标信息,难以模拟真实的类别统计信息.另一个是特征破坏问题,这意味着模型只关注当前类别而不关注潜在类别.本文提出了一个基于对比原型以及背景挖掘的新网络.该网络主要思想是使模型学习更具代表性的原型,并从背景中识别潜在类别.具体而言,特定类学习分支构建了一个大且一致的原型字典,然后使用InfoNCE损失使原型更具区分性.另一方面,背景挖掘分支初始化背景原型,并使用构建的背景原型与字典之间的注意力机制来挖掘潜在类别.在PASCAL-5i和COCO-20i数据集上的实验证明模型有优秀的性能.在使用ResNet-50网络的1-shot设置下,达到了64.9%和44.2%,相较于基准模型分别提升了4.0%和1.9%. 展开更多
关键词 图像分割 样本语义分割 对比学习 背景挖掘
下载PDF
基于迁移学习的军事少样本集成分类研究
13
作者 鲁磊纪 余红霞 +1 位作者 肖红菊 鲍蕾 《计算机科学与应用》 2024年第8期230-235,共6页
深度神经网络是一种需要大量的数据来进行有效训练的模型。军事装备类数据普遍存在数据量较少,无法满足深度神经网络的训练需求,容易出现过拟合的问题。针对该问题,本文引入迁移学习技术,通过构建多类型样本训练集,微调预训练模型,构建... 深度神经网络是一种需要大量的数据来进行有效训练的模型。军事装备类数据普遍存在数据量较少,无法满足深度神经网络的训练需求,容易出现过拟合的问题。针对该问题,本文引入迁移学习技术,通过构建多类型样本训练集,微调预训练模型,构建军事装备类集成分类器。实践证明迁移学习在少样本分类任务中的应用节省了模型训练时间,解决了模型过拟合及对数据标签依赖性强的问题,能有效提高基于深度学习的军事装备类小样本图像分类的准确性。A large amount of data is indispensable for effective training of deep neural networks. Military equipment data generally suffers from insufficient quantities, which fails to meet the training requirements of deep neural networks and easily leads to over fitting. To address this issue, this paper introduces transfer learning technology by constructing a multi-type sample training set and fine-tuning pre-trained models, and an ensemble classifier for military equipment is built. Experimental results have confirmed that transfer learning saves training time on small samples tasks, resolves issues of model over fitting and strong dependence on data labels simultaneously, and can effectively improve the accuracy of small sample image classification of military equipment based on deep learning. 展开更多
关键词 样本图像分类 迁移学习 卷积神经网络 集成
下载PDF
基于提示学习的市政道路工程设计标准少样本实体分类研究
14
作者 汪川东 刘东博 韩世晨 《大众标准化》 2024年第17期73-76,共4页
市政道路工程标准数字化是当前新兴的领域,而细粒度实体分类研究是高质量完成标准数字化诸多下游任务的基础。文章以西部(重庆)科学城北碚高新产业园综合开发项目中的市政道路工程为应用场景,针对现有基于提示学习的细粒度实体分类方法... 市政道路工程标准数字化是当前新兴的领域,而细粒度实体分类研究是高质量完成标准数字化诸多下游任务的基础。文章以西部(重庆)科学城北碚高新产业园综合开发项目中的市政道路工程为应用场景,针对现有基于提示学习的细粒度实体分类方法未能充分利用标签本体结构的问题,提出了新的层级感知方法。首先,根据本体的层次结构,在提示模板中用多个特殊标记去预测各层级的标签;其次,根据输入样本动态地聚合各个层次标签的信息,以软提示词的形式注入预训练语言模型的输入中;最后,以本体树状结构中的路径为单位对标签进行解码。实验结果表明,提出的模型性能优于传统扁平化的提示学习方法。 展开更多
关键词 细粒度实体分类 提示学习 样本 标准数字化
下载PDF
基于改进U-net的少样本煤岩界面图像分割方法 被引量:1
15
作者 卢才武 宋义良 +3 位作者 江松 章赛 王懋 纪凡 《金属矿山》 CAS 北大核心 2024年第1期149-157,共9页
煤岩图像语义分割技术是煤岩界面识别的重要研究方向,现有的语义分割模型通常依赖于大样本数据集进行训练,然而目前已标注的煤岩图像数据样本难以获取,并且缺乏公开数据集。针对以上问题,提出了一种基于改进U-net模型的样本煤岩界面图... 煤岩图像语义分割技术是煤岩界面识别的重要研究方向,现有的语义分割模型通常依赖于大样本数据集进行训练,然而目前已标注的煤岩图像数据样本难以获取,并且缺乏公开数据集。针对以上问题,提出了一种基于改进U-net模型的样本煤岩界面图像分割模型。将裁剪后具有更强特征提取能力且结构上更为简单的VGG16替换U-net的原始骨干特征提取网络,提升对图像信息的特征提取能力并获得更快的训练速度,在U-net网络的跳跃连接和解码器上采样部分引入注意力机制模块,对提取的特征层进行处理,提升模型对煤岩界面图像关键特征的提取能力,提高分割精度。使用迁移学习方法对改进的模型进行预训练,提高模型泛化能力同时避免过拟合,使模型更适用于小样本数据集训练。通过使用自制的煤岩界面数据集对所改进的网络模型性能进行验证,并将该模型与经典Unet、DeepLabv3+、PspNet、HrNet网络模型进行了对比。试验结果表明:在同样使用由125幅煤岩界面图片构建的小样本数据集进行训练的情况下,所提改进模型相较于经典U-net模型在分割精确度和检测效率方面都有显著提升,模型精确度提高了1.84%,平均交并比提高了5.34%,类别平均像素准确率提高了0.48%,检测速度增幅为5.3%。同时,与其他网络模型相比,所提改进模型在小样本煤岩界面图像的语义分割中优势显著,表明所提改进思路的有效性。 展开更多
关键词 煤岩识别 语义分割 样本学习 U-net 深度学习 机器视觉技术
下载PDF
关系信息增强的少样本关系分类原型表示研究
16
作者 王磊 任鹏瑞 瞿剑峰 《小型微型计算机系统》 CSCD 北大核心 2024年第7期1615-1621,共7页
少样本关系分类任务旨在只使用极少量样本来识别出句子中给定实体对的关系,现有工作在FewRel 1.0数据集上进行了大量研究,并没有考虑“以上都不是”(none-of-the-above,NOTA)关系的检测问题,而已有的考虑NOTA关系的工作都是在间接地计... 少样本关系分类任务旨在只使用极少量样本来识别出句子中给定实体对的关系,现有工作在FewRel 1.0数据集上进行了大量研究,并没有考虑“以上都不是”(none-of-the-above,NOTA)关系的检测问题,而已有的考虑NOTA关系的工作都是在间接地计算查询样例与NOTA的相似度,这容易导致误差累积,模型性能因此表现不佳.为此,本文提出了一种基于关系信息增强的能够直接生成NOTA关系原型表示的方法.首先,本文提出了一种易混淆实例采样策略,通过挑选出信息丰富且易混淆的实例作为NOTA关系的支持数据并直接计算NOTA关系的原型表示;然后,本文使用了关系名和关系的描述信息作为外部关系信息,来提供给模型更多可用信息以生成更准确的原型表示.在广泛使用的FewRel 2.0数据集上的大量实验结果证明了本文提出的方法的优越性. 展开更多
关键词 样本学习 关系分类 原型网络 易混淆实例 关系信息
下载PDF
基于VGG网络的少样本图像分类方法研究
17
作者 王国明 李苗苗 《电脑知识与技术》 2024年第17期6-10,共5页
图像分类是计算机视觉领域的热门研究之一。然而,深度神经网络在面对少样本学习时,可能因数据量不足导致过拟合等问题。为此,提出了一种基于VGG网络模型的多层次滤波器方法(IVGG)。首先,在VGG网络中引入滤波器组,通过采用1×1、3... 图像分类是计算机视觉领域的热门研究之一。然而,深度神经网络在面对少样本学习时,可能因数据量不足导致过拟合等问题。为此,提出了一种基于VGG网络模型的多层次滤波器方法(IVGG)。首先,在VGG网络中引入滤波器组,通过采用1×1、3×3和5×5多层次滤波器组,从多个角度获取图像的形状和纹理等特征信息,从而避免单一滤波器的不足。然后,在卷积层之后引入批归一化处理,可缓解梯度消失、增加模型鲁棒性和学习速率。通过在四种数据集上的对比实验,结果表明,IVGG与DN4、MACO和CovaMNet方法相比,对少样本图像的分类准确率提高了0.82%~1.87%,并且损失值降低了0.02~0.18。证明该方法在处理少样本图像分类中具有更高的准确率与更低的损失值,同时能一定程度上减小网络模型的复杂度。 展开更多
关键词 VGG网络 图像分类 样本学习 滤波器组 批归一化
下载PDF
基于特征分段度量方法的少样本学习
18
作者 冯兴杰 王晨昊 《计算机应用与软件》 北大核心 2023年第1期222-227,共6页
已有的基于度量方法的少样本学习直接在元学习框架下优化模型以在少样本任务上获得好的表现,但这种直接通过元学习策略训练得到的特征表示传递性较弱,从而限制了度量方法的分类能力。针对该问题提出一种新的模型结构,包括特征映射模块... 已有的基于度量方法的少样本学习直接在元学习框架下优化模型以在少样本任务上获得好的表现,但这种直接通过元学习策略训练得到的特征表示传递性较弱,从而限制了度量方法的分类能力。针对该问题提出一种新的模型结构,包括特征映射模块和分段度量模块。在基类数据上预先训练分类器并迁移到元学习的特征提取模块;在元学习阶段,对提取到的特征分多段进行余弦相似度的计算,以预测类别。实验在mini-imagenet数据集的5-way 1-shot和5-way 5-shot情况下分别达到64.33%和80.11%的准确率,在复杂场景下具有更好的识别效果。 展开更多
关键词 深度学习 学习 样本学习 分段度量 余弦相似度
下载PDF
前缀调优的少样本命名实体识别
19
作者 吕海啸 李益红 周晓谊 《计算机科学与探索》 CSCD 北大核心 2024年第8期2180-2189,共10页
少样本命名实体识别通常使用基于相似性的度量,为了能够充分利用模型参数中的知识转移,提出一种前缀调优的少样本命名实体识别方法(P-NER)。将输入文本的特征向量放入嵌入模块进行特征提取;把前缀提示的向量参数拼接到编码层模型的前端... 少样本命名实体识别通常使用基于相似性的度量,为了能够充分利用模型参数中的知识转移,提出一种前缀调优的少样本命名实体识别方法(P-NER)。将输入文本的特征向量放入嵌入模块进行特征提取;把前缀提示的向量参数拼接到编码层模型的前端,并将编码层模型参数进行固定;对编码层得到的结果进行交叉熵模型的解码,并对每个训练样本采样两个子模型,通过最小化两个子模型之间相对熵的方式达到对模型预测进行正则化的目的;通过验证输出概率和真实标签概率来衡量模型对每个词的标签预测与实际标签的一致程度并输出分类结果。实验结果表明在CoNLL2003数据集上,该方法的域内少样本实体识别的平均F1得分为84.92%,在跨领域少样本实体识别的MIT Movie、MIT Restaurant和ATIS三个数据集中均领先其他基线方法的结果。因此,该方法可在只需要调节以往微调方法的2.9%参数的情况下,显著提高少样本命名实体识别的效果。 展开更多
关键词 命名实体识别(NER) 样本学习 提示学习
下载PDF
基于标签提示和门控模块的少样本命名实体识别
20
作者 吕明翰 黄琪 +1 位作者 罗文兵 王明文 《中文信息学报》 CSCD 北大核心 2024年第9期117-125,共9页
少样本命名实体识别旨在利用少量样本实现命名实体的自动识别。近年来两阶段原型网络在少样本命名实体识别任务上取得了较好的效果,但仍存在跨度检测假阳性和跨度分类原型不准确的问题。针对上述两类问题,该文提出一种基于标签提示和门... 少样本命名实体识别旨在利用少量样本实现命名实体的自动识别。近年来两阶段原型网络在少样本命名实体识别任务上取得了较好的效果,但仍存在跨度检测假阳性和跨度分类原型不准确的问题。针对上述两类问题,该文提出一种基于标签提示和门控模块的少样本命名实体识别模型。在跨度检测阶段,利用标签提示信息优化句子表示,减少假阳性的出现。在跨度分类阶段,通过引入门控模块,显式地利用标签信息和样本原型进行融合,分别提取标签信息和样本信息中的有效信息,以获得更准确的原型表示。在多个数据集上的实验结果表明,该文所提出的方法相较于基准模型在F 1值上能够取得10.63%的提升,并且消融实验也表明该文模型各个模块的有效性。 展开更多
关键词 样本学习 命名实体识别 原型网络
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部