基于多粒度表征藏文古籍文档版面分析方法研究

下载PDF

导出

摘要藏文古籍文档版面分析是对文档图像中插图、文本段、文本行、标题等区域信息进行分析并提取的一种方法,是古籍数字化的重要研究课题。相较其他语种的历史文档,藏文古籍文档版面布局呈现出版面结构更加复杂、字体形状和大小风格多样化等特点。该文针对藏文古籍文献特征,构建手写体、印刷体、木刻雕版三种版面结构及字体不同的藏文古籍图像数据集,并将基于CNN和VIsion Transformer并行架构的AFFormer通用语义分割模型迁移到藏文古籍版面分析任务上。在合并数据集上不同版面区域的6个类别平均交并比MIoU达到93.6%。通过实验表明,AFFormer模型对藏文古籍版面分析数据集上的粗粒度版面区域和细粒度文本行检测与提取性能优于其他语义分割的基线模型,该方法在藏文古籍版面分析任务上具有较高的可行性。

作者白玛旺久格桑多吉扎西多吉杨欣

机构地区西藏大学信息科学技术学院

出处《电脑知识与技术》 2023年第36期1-3,共3页 Computer Knowledge and Technology

基金国家自然科学基金项目(62066042,61961038) 西藏大学研究生高水平人才培养计划项目:基于多粒度表征的手写藏文古籍版面分析(项目编号:2021-GSP-S130)。

关键词藏文古籍版面分割多粒度注意力机制

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献3

1李金成,王筱娟,王维兰,林强,胡鹏飞.结合文字核心区域和扩展生长的藏文古籍文本行切分[J].激光与光电子学进展,2021,58(2):105-115. 被引量：3
2任方针,王秀友,朱弋,时如梦,王胜波,刘华明.基于SVM的藏文古籍版面分割[J].阜阳师范大学学报（自然科学版）,2021,38(2):92-96. 被引量：2
3贡去卓么,才让加,三知加.基于语义分割的藏文古籍文档文本区域检测[J].计算机仿真,2022,39(5):448-454. 被引量：2

二级参考文献13

1程娟,平西建,周冠玮.基于多特征和SVM的文本图像版面分类方法[J].数据采集与处理,2008,23(5):569-574. 被引量：6
2王华,丁晓青.一种多字体印刷藏文字符识别方法[J].计算机工程,2004,30(13):18-20. 被引量：10
3杨晓娟,宋凯.基于投影法的文档图像分割算法[J].成都大学学报（自然科学版）,2009,28(2):139-141. 被引量：9
4张利,朱颖,吴国威.基于游程平滑算法的英文版面分割[J].电子学报,1999,27(7):102-104. 被引量：8
5于明,郭佥,王栋壮,于洋.改进的基于连通域的版面分割方法[J].计算机工程与应用,2013,49(17):195-198. 被引量：8
6魏传义,陈勤,张旻.基于投影的文本图像版面分割算法研究[J].现代计算机,2016,22(7):33-38. 被引量：4
7王莉丽,陈晔,刘玲.基于投影轮廓分析的文本图像版面分割算法研究[J].数字技术与应用,2017,35(3):164-165. 被引量：6
8段立娟,张西群,马龙龙,吴健.Text extraction method for historical Tibetan document images based on block projections[J].Optoelectronics Letters,2017,13(6):457-461. 被引量：3
9张新红,张一凡,张帆.基于Shearlet变换的扫描文档图像倾斜检测[J].激光与光电子学进展,2018,55(1):237-244. 被引量：2
10张西群,马龙龙,段立娟,刘泽宇,吴健.基于卷积降噪自编码器的藏文历史文献版面分析方法[J].中文信息学报,2018,32(7):67-73. 被引量：12

共引文献4

1张策,王维兰.基于结构属性的乌金体藏文古籍字符切分[J].激光与光电子学进展,2021,58(20):252-267. 被引量：2
2李林国,钱顺强,李章飞,李淑敬.基于混沌初始化的缎蓝园丁鸟优化算法在图像分割中的应用研究[J].阜阳师范大学学报（自然科学版）,2022,39(4):56-61. 被引量：1
3才让当知,黄鹤鸣,范玉涛,樊永红.基于双注意力YOLOv5的场景藏文检测[J].计算机工程与设计,2023,44(11):3411-3419.
4王维兰,胡金水,魏宏喜,库尔班·吾布力,邵文苑,毕晓君,贺建军,李振江,丁凯,金连文,高良才.少数民族文字文本分析与识别的研究进展[J].中国图象图形学报,2024,29(6):1685-1713.

1龙欢.新时代背景下图书馆古籍数字化建设路径探析[J].图书馆学刊,2023,45(10):28-32. 被引量：4
2何立斌,刘剑,廖隆恒.基于视觉理解的高速路网指路情报信息优化设计研究[J].信息系统工程,2023(7):67-70.
3一种带有可变图案的光致变色多彩水性绒面超纤革[J].皮革制作与环保科技,2023,4(20):4-4.
4陈清钰,张艳艳,赵伟毓.基于并行双通道时空网络的流量数据修复技术[J].计算机系统应用,2024,33(1):99-109. 被引量：1
5黑土文艺·奇葩纷呈[J].黑龙江档案,2023(5).
6敬请订阅2024年度《中国新闻出版广电报》[J].新闻战线,2023(23).
7杨翕丞.现代汉字标点符号演变及其在文字设计中的挑战[J].印刷文化（中英文）,2023(2):99-129.
8孟建华.北宋交子发行的过程时间、作用意义及“千斯仑”钞版考——纪念世界最早纸币交子发行1000周年[J].福建金融,2023(10):65-70.
9韩凯琦,陈乐薇.古籍数字出版现状、问题与前景探析[J].传播与版权,2024(2):29-31.
10赵启蒙.古籍整理出版助推齐鲁文化“两创”研究——以《齐鲁文库》为例[J].人文天下,2023(11):47-52.

电脑知识与技术

2023年第36期

浏览历史

内容加载中请稍等...

基于多粒度表征藏文古籍文档版面分析方法研究

参考文献3

二级参考文献13

共引文献4

相关作者

相关机构

相关主题

浏览历史