期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于K-shot学习的满文识别方法
1
作者 辛守宇 陈荣 王子童 《电脑编程技巧与维护》 2024年第10期131-133,共3页
满文识别是满文数字化保护的关键环节,但满文样本数量难以满足深度学习模型训练对数据量的要求。针对满文样本数量较少的问题,构建了一种基于K-shot学习的满文识别方法。首先,利用收集的满文文字图像数据,整理并建立了共有666个类别的... 满文识别是满文数字化保护的关键环节,但满文样本数量难以满足深度学习模型训练对数据量的要求。针对满文样本数量较少的问题,构建了一种基于K-shot学习的满文识别方法。首先,利用收集的满文文字图像数据,整理并建立了共有666个类别的小样本满文图像数据集。其次,满文单词的字形比较相似,传统的K-shot学习算法对字形相似的满文单词难以区分,极大影响了模型的识别精度,提出了一种利用支持集信息的K-shot学习模型,基本思想是将支持集加入到模型的训练过程中,通过定义一个新的损失函数,使得支持集中的样本之间的距离尽可能大,以此加强模型对不同满文单词的区分能力。实验结果表明,算法在200类的小样本满文识别场景下可以达到90.4%的识别准确率。 展开更多
关键词 满文识别 小样本学习 K-shot学习 深度卷积神经网络
下载PDF
训练过程中使用支持集信息的单样本学习算法
2
作者 辛守宇 郑蕊蕊 +2 位作者 周瑜 刘文鹏 贺建军 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第8期1187-1192,共6页
单样本学习的目的是利用一个包含大量训练样本的源类别数据集以及每个类别只包含一个训练样本的目标类别数据集来构建一种学习算法,使得算法能够对目标类别空间中的样本进行准确分类.已有的单样本学习算法主要是先利用源类别数据来训练... 单样本学习的目的是利用一个包含大量训练样本的源类别数据集以及每个类别只包含一个训练样本的目标类别数据集来构建一种学习算法,使得算法能够对目标类别空间中的样本进行准确分类.已有的单样本学习算法主要是先利用源类别数据来训练模型,然后在测试时将目标类别训练数据作为支持集来实现对未标注样本的分类,因此在训练时没有有效地利用支持集的信息.为此提出一种在训练阶段和测试阶段同时利用支持集信息的单样本学习算法,基本思想是利用孪生神经网络构建模型并在训练时加入支持集信息,即让不同类别的支持集样本之间的相似度尽可能小.在Omniglot数据集和满文识别问题上的实验结果表明,该算法能取得较好的识别准确率. 展开更多
关键词 单样本学习 孪生神经网络 度量学习
下载PDF
一种基于N元ECOC的大类别K-shot满文识别方法 被引量:3
3
作者 郑蕊蕊 辛守宇 +3 位作者 周瑜 刘文鹏 党佳伟 贺建军 《郑州大学学报(理学版)》 北大核心 2021年第4期53-60,共8页
由于训练数据获取困难,满文识别被视为典型的K-shot学习问题。但在实际应用场景中,满文识别需要面对的类别数量是极大的,传统的K-shot学习算法并不适用。构建了一种面向大类别识别问题的K-shot学习算法,基本策略是利用N元纠错输出编码(e... 由于训练数据获取困难,满文识别被视为典型的K-shot学习问题。但在实际应用场景中,满文识别需要面对的类别数量是极大的,传统的K-shot学习算法并不适用。构建了一种面向大类别识别问题的K-shot学习算法,基本策略是利用N元纠错输出编码(error correcting output coding,ECOC)技术将原本的大类别分类问题分解为一系列较小类别的分类问题再进行处理。算法包括编码和解码两个阶段:在编码阶段,利用N元ECOC编码矩阵将大类别支持集分解为一系列小类别的子支持集,并根据子支持集生成多个K-shot学习基分类器;解码阶段利用上述基分类器对测试样本分类再合并为一个预测编码,然后将预测编码对照编码矩阵纠错,进而确定最终分类类别。实验结果表明,在500类满文数据集上获得了87.8%的识别准确率。 展开更多
关键词 满文识别 小样本学习 K-shot学习 纠错输出编码(ECOC) 深度卷积神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部