-
题名嵌入注意力机制的自然场景文本检测方法
被引量:7
- 1
-
-
作者
杨锶齐
易尧华
汤梓伟
王新宇
-
机构
武汉大学印刷与包装系
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第24期185-191,共7页
-
基金
国家科技重大专项(2017ZX01030102)。
-
文摘
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法。利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改进锚点(anchor)的设置,精确了文本候选区域;重新设定损失函数的作用范围。实验结果表明,该方法有效地保证文本检测信息的完整性,较之现有方法明显地提高了文本检测的召回率和准确率,能够应用于文本检测的实际任务中。
-
关键词
自然场景文本检测
特征金字塔网络
区域建议网络
注意力机制
-
Keywords
natural scene text detection
feature pyramid network
region proposal network
attention mechanism
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名自然场景文本检测关键技术及应用
被引量:3
- 2
-
-
作者
易尧华
杨锶齐
王新宇
汤梓伟
-
机构
武汉大学印刷与包装系
-
出处
《数字印刷》
北大核心
2020年第4期1-11,22,共12页
-
文摘
场景文本信息理解是计算机视觉任务(诸如智能导航等)的基础,基于卷积神经网络的自然场景图像文本检测是计算机视觉领域的研究热点。本文梳理自然场景文本检测方法体系,归纳总结场景文本检测方法、评价协议及测试数据集;阐述分析自然场景文本检测的关键技术及应用领域;展望自然场景文本检测的发展趋势。
-
关键词
自然场景
卷积神经网络
文本检测
关键技术
-
Keywords
Natural scene
Convolutional neural network
Text detection
Key technology
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-
-
题名基于线性误差增强的彩色3D打印网目调重建方法
被引量:1
- 3
-
-
作者
易尧华
王笑
何婧婧
杨锶齐
-
机构
武汉大学印刷与包装系
-
出处
《数字印刷》
北大核心
2019年第1期32-39,共8页
-
基金
国家科技重大专项(NO.2017ZX01030102)
-
文摘
三维误差扩散网目调重建方法为彩色3D打印提供精细的颜色阶调还原再现技术,常用的三维误差扩散网目调重建方法存在对原数据垂直方向上颜色阶调再现不均匀等问题。本研究提出了一种顾及人眼阶调敏感性的三维误差扩散滤波器,并在误差扩散过程中根据阶调线性增强误差信号再进行网目调二值化处理。同时,考虑3D打印材料透明度的影响,提出基于光线投射的3D打印网目调重建的仿真方法。依据数据切片及光线投射仿真,比较分析不同误差扩散网目调算法对数据垂直方向上的颜色阶调再现效果。结果表明,基于线性误差增强的彩色3D打印网目调重建算法具有较好的颜色阶调再现效果。
-
关键词
彩色3D打印
网目调重建
线性误差增强
光线投射
-
Keywords
Color 3D printing
Halftone reconstruction
Linear error enhancement
Ray casting
-
分类号
TP391.73
[自动化与计算机技术—计算机应用技术]
-