-
题名自然场景盲文图像数据集及盲文段检测方法
- 1
-
-
作者
卢利琼
陈长江
吴东
熊建芳
-
机构
岭南师范学院计算机与智能教育学院
广东省特殊儿童发展与教育重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第10期171-177,共7页
-
基金
广东省教育厅特色创新项目(2021KTSCX065)
广东省特殊儿童发展与教育重点实验室项目(TJ202011)
广东省湛江市科技发展专项资金竞争性分配项目(2022A01005)。
-
文摘
盲文检测是利用人工智能技术自动检测出图像中的盲文位置,是盲文书籍电子化、盲文自动阅卷以及加强正常人与盲人无障碍交流的关键技术。然而现有盲文检测研究领域缺乏自然场景盲文图像数据集和盲文段检测方法。为此,利用手机拍摄、网络下载等手段构建包含554幅图像的自然场景盲文图像数据集,并对数据集中每一幅图像的盲文段位置进行手动标记。从亮度、对比度和柔和度变化的角度设计图像增强策略来扩充自然场景盲文图像数据集,以辅助卷积神经网络(CNN)训练。在此基础上,分析自然场景盲文段在书写形式和结构上的特点,基于Faster R-CNN算法的思想,提出一种自然场景盲文段检测方法。以ResNet50作为主干网络,通过设计多尺寸CNN特征融合策略挖掘不同尺寸盲文段的特征,设计从32到512的多种锚框参数,以适应自然场景图像中盲文段高度变化小而宽度变化大以及存在较多小尺寸盲文段的特点。实验结果表明,与经典目标检测算法Faster R-CNN和SSD相比,该方法 Hmean值分别从0.793 5和0.800 1提升至0.887 9,检测性能提升明显。
-
关键词
自然场景图像
盲文段检测
卷积神经网络
Faster
R-CNN算法
SSD算法
-
Keywords
natural scene image
Braille segment detection
Convolutional Neural Network(CNN)
Faster R-CNN algorithm
SSD algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-