针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处...针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处理。运用各类包括支持向量机、前馈神经网络和卷积网络等线性统计和深度学习方法对数据集中的藏文字丁进行了识别实验。对实验结果进行评测后,提出的基于神经网络的模型可以使多字体藏文印刷体识别任务在测试集上的识别率、召回率和F1值分别达到了97%、96.6%和96.6%,证实了上述方法的有效性,为后续藏文文字识别提供了一定的理论和研究的基础。展开更多
文摘针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处理。运用各类包括支持向量机、前馈神经网络和卷积网络等线性统计和深度学习方法对数据集中的藏文字丁进行了识别实验。对实验结果进行评测后,提出的基于神经网络的模型可以使多字体藏文印刷体识别任务在测试集上的识别率、召回率和F1值分别达到了97%、96.6%和96.6%,证实了上述方法的有效性,为后续藏文文字识别提供了一定的理论和研究的基础。