期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于迁移学习的敦煌藏文古籍整页识别
1
作者 杨晓龙 高红梅 +1 位作者 高定国 达措 《中文信息学报》 CSCD 北大核心 2023年第11期29-37,共9页
为了解决复杂背景下,文字风格多样导致整页文本识别模型识别精度低和网络难以收敛的问题,该文对基于迁移学习的整页识别算法(垂直注意力网络)进行改进。首先对《法国国家图书馆藏敦煌藏文文献》第一册的319张数据进行了构建和标注,通过... 为了解决复杂背景下,文字风格多样导致整页文本识别模型识别精度低和网络难以收敛的问题,该文对基于迁移学习的整页识别算法(垂直注意力网络)进行改进。首先对《法国国家图书馆藏敦煌藏文文献》第一册的319张数据进行了构建和标注,通过印刷体合成等方式对数据集进行扩充,使实验数据达到2 367张图片;其次,为了增强行特征提取能力和加快网络收敛速度,使用自适应平均值池化对行特征提取模块和使用门循环单元对解码器进行了改进;最后将行训练模型迁移到改进的整页文本识别任务中实现对敦煌藏文文字的识别。实验结果表明,在拥有行级的标注情况下,使用迁移学习相比主流的整页识别模型降低了0.73%的字符错误率,验证了该模型在数据稀缺情况下对整页文本识别的有效性。 展开更多
关键词 文本识别 迁移学习 到端整识别
下载PDF
藏文敦煌字体的整页文本识别研究 被引量:1
2
作者 杨晓龙 高红梅 高定国 《电子技术与软件工程》 2022年第16期221-227,共7页
本文首先提出了整页文本数据集的合成方法。其次使用合成数据分析近几年4种整页文本识别算法的特点以及优劣,最后在这些模型的基础上,对识别错误率较高的模型,使用不同特征提取网络在测试集进行实验以提升准确率。实验分析了4种整页文... 本文首先提出了整页文本数据集的合成方法。其次使用合成数据分析近几年4种整页文本识别算法的特点以及优劣,最后在这些模型的基础上,对识别错误率较高的模型,使用不同特征提取网络在测试集进行实验以提升准确率。实验分析了4种整页文本识别模型在藏文敦煌体识别任务上的性能,经过微调后准确率均达到了90%以上。 展开更多
关键词 文字识别 藏文古籍 端到端整页识别计算机
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部