针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处...针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处理。运用各类包括支持向量机、前馈神经网络和卷积网络等线性统计和深度学习方法对数据集中的藏文字丁进行了识别实验。对实验结果进行评测后,提出的基于神经网络的模型可以使多字体藏文印刷体识别任务在测试集上的识别率、召回率和F1值分别达到了97%、96.6%和96.6%,证实了上述方法的有效性,为后续藏文文字识别提供了一定的理论和研究的基础。展开更多
90年代的字体之争是Adobe与Macrosoft之间的竞争.他们分别为其PostScript Type one和True Type两种字体形式的未来竞相争夺。然而.在90年代末期.这两家公司却联手开发了Open Type字体,并使其成为了这一产业中首例可以在Mac和Window...90年代的字体之争是Adobe与Macrosoft之间的竞争.他们分别为其PostScript Type one和True Type两种字体形式的未来竞相争夺。然而.在90年代末期.这两家公司却联手开发了Open Type字体,并使其成为了这一产业中首例可以在Mac和Windows平台下运行的单个字体文件。展开更多
文摘针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处理。运用各类包括支持向量机、前馈神经网络和卷积网络等线性统计和深度学习方法对数据集中的藏文字丁进行了识别实验。对实验结果进行评测后,提出的基于神经网络的模型可以使多字体藏文印刷体识别任务在测试集上的识别率、召回率和F1值分别达到了97%、96.6%和96.6%,证实了上述方法的有效性,为后续藏文文字识别提供了一定的理论和研究的基础。
文摘90年代的字体之争是Adobe与Macrosoft之间的竞争.他们分别为其PostScript Type one和True Type两种字体形式的未来竞相争夺。然而.在90年代末期.这两家公司却联手开发了Open Type字体,并使其成为了这一产业中首例可以在Mac和Windows平台下运行的单个字体文件。