摘要
藏文古籍文档版面分析是对文档图像中插图、文本段、文本行、标题等区域信息进行分析并提取的一种方法,是古籍数字化的重要研究课题。相较其他语种的历史文档,藏文古籍文档版面布局呈现出版面结构更加复杂、字体形状和大小风格多样化等特点。该文针对藏文古籍文献特征,构建手写体、印刷体、木刻雕版三种版面结构及字体不同的藏文古籍图像数据集,并将基于CNN和VIsion Transformer并行架构的AFFormer通用语义分割模型迁移到藏文古籍版面分析任务上。在合并数据集上不同版面区域的6个类别平均交并比MIoU达到93.6%。通过实验表明,AFFormer模型对藏文古籍版面分析数据集上的粗粒度版面区域和细粒度文本行检测与提取性能优于其他语义分割的基线模型,该方法在藏文古籍版面分析任务上具有较高的可行性。
出处
《电脑知识与技术》
2023年第36期1-3,共3页
Computer Knowledge and Technology
基金
国家自然科学基金项目(62066042,61961038)
西藏大学研究生高水平人才培养计划项目:基于多粒度表征的手写藏文古籍版面分析(项目编号:2021-GSP-S130)。