期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向多角度文字检测的旋转交并比神经网络
1
作者 姚宏扬 仝明磊 施漪涵 《计算机应用与软件》 北大核心 2023年第2期230-235,共6页
边界框回归是文字检测中关键的步骤,为了更好地预测边界框和收敛网络参数,在Faster RCNN目标检测算法的基础上提出一种利用旋转交并比损失函数的神经网络。该损失函数根据文字检测的评价指标而设计,增加预测框的角度参数,将其与宽和高... 边界框回归是文字检测中关键的步骤,为了更好地预测边界框和收敛网络参数,在Faster RCNN目标检测算法的基础上提出一种利用旋转交并比损失函数的神经网络。该损失函数根据文字检测的评价指标而设计,增加预测框的角度参数,将其与宽和高的参数一起代入损失函数的惩罚项,代替了原版用于边界框回归的smooth L1损失函数,转化为交并比的损失向神经网络进行反向传播,并着重优化边界框的方向信息,通过设计与角度惩罚项相同的阈值运算作为非极大值抑制来输出检测结果。在公开文字检测数据集ICDAR2015上的实验结果表明,该方法有效提高了网络的收敛速度和检测精准度,比原方法综合提升11百分点左右。 展开更多
关键词 文字检测 神经网络 损失函数 边界框回归 交并比
下载PDF
基于双塔结构的场景文字检测模型 被引量:2
2
作者 施漪涵 仝明磊 +1 位作者 张魁 姚宏扬 《计算机工程与应用》 CSCD 北大核心 2022年第3期242-248,共7页
当图像中文字区域形状复杂多变时,传统锚点方法难以精确定位文字,针对这一问题,提出一种具有双塔结构的文字分割检测算法。在网络中增加自下而上的特征增强路径以充分提炼语义信息,与上一级自上而下的结构形成双金字塔模型;接着新增一... 当图像中文字区域形状复杂多变时,传统锚点方法难以精确定位文字,针对这一问题,提出一种具有双塔结构的文字分割检测算法。在网络中增加自下而上的特征增强路径以充分提炼语义信息,与上一级自上而下的结构形成双金字塔模型;接着新增一条路径缩短较底层与最顶层特征之间的距离,同时使用膨胀卷积,增大卷积核的感受野;在损失函数的设计中引入γ参数,改变图像中正负样本的权重分配,使网络更关注困难样本。在标准数据集ICDAR2015和ICDAR2017上进行评估,实验结果表明提出的双塔结构模型能有效提高网络对文字区域的检测准确度。 展开更多
关键词 卷积神经网络 特征融合 文字检测 图像分割
下载PDF
基于PSENet的自然场景文字检测网络改进 被引量:3
3
作者 施漪涵 仝明磊 《上海电力大学学报》 CAS 2021年第1期73-77,共5页
由于自然场景中的图像背景复杂、文字排列不规则、光照条件不确定等因素,文字检测难度较大,且传统检测方法的效果并不理想。在研究文字分割检测方法PSENet(Progressive Scale Expansion Network)的基础上,提出了一种针对自然场景文字检... 由于自然场景中的图像背景复杂、文字排列不规则、光照条件不确定等因素,文字检测难度较大,且传统检测方法的效果并不理想。在研究文字分割检测方法PSENet(Progressive Scale Expansion Network)的基础上,提出了一种针对自然场景文字检测的改进方法。该方法由卷积神经网络提取特征模块,再通过渐进式规模扩张对文字区域进行分割检测。改进点主要是使用高精度的语义分割网络RefineNet(Refinement Network),对卷积网络特征提取模块进行优化,且增加较多的残差连接及链式池化,提高网络对文字区域的检测精度。通过对数据集ICDAR2015的实验结果对比,表明所提出的改进算法在精度方面略高于改进前,且能更好地解决文字粘连问题。 展开更多
关键词 文字检测 图像分割 特征融合
下载PDF
基于RefineNet特征融合的改进EAST场景文本检测方法 被引量:1
4
作者 张魁 仝明磊 +1 位作者 施漪涵 唐丽 《计算机应用与软件》 北大核心 2022年第4期223-227,319,共6页
特征融合是文本检测算法的重要步骤。为提升文本检测的召回率和准确率,提出一种利用RefineNet(Refinement Network)网络进行特征融合的改进EAST(Efficient and Accurate Scene Text Detector)算法。以ResNet(Residual Network)残差网络... 特征融合是文本检测算法的重要步骤。为提升文本检测的召回率和准确率,提出一种利用RefineNet(Refinement Network)网络进行特征融合的改进EAST(Efficient and Accurate Scene Text Detector)算法。以ResNet(Residual Network)残差网络作为特征提取层的骨干网络,提取出2-5层的特征图;用RefineNet取代East模型中的维度拼接算法,融合多分辨率特征,将4路特征图合并成1路RCU(Residual Conv Unit)输出;经过卷积、池化和上采样等操作在输出层得到文本框的置信度、文本框的位置信息以及文本框旋转角度,通过非最大值抑制输出检测结果。实验结果表明,在相同实验环境条件下,采用该方法比原EAST方法准确率提高约2百分点,召回率提高约8百分点。 展开更多
关键词 文本检测 残差网络 特征提取 特征融合
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部