在解决目标检测任务的模型中,基于多阶段检测框架的模型相对单阶段和两阶段检测框架的模型具有明显的精度优势。该研究的主要目的是通过使用基于长短时记忆网络(Long Short Term Memory,LSTM)的多次迭代回归模块来改进广泛使用的两阶段...在解决目标检测任务的模型中,基于多阶段检测框架的模型相对单阶段和两阶段检测框架的模型具有明显的精度优势。该研究的主要目的是通过使用基于长短时记忆网络(Long Short Term Memory,LSTM)的多次迭代回归模块来改进广泛使用的两阶段回归框架。在该研究中,基于LSTM的候选框迭代优化模块被设计用来不断优化候选框生成网络(Region Proposal Network,RPN)所提出的候选框。该模块不仅能够灵活的与各种框架进行集成,同时还可以根据训练和测试阶段对检测速度需求的不同而任意的配置迭代次数。为了验证该方法的有效性,该研究采用基于ResNet-50和ResNet-101为主干网络的多个检测框架,并在两个公开数据集上进行了大量实验。结果表明,该方法得到的所有类平均精度(mean Average Procession,mAP)明显高于基准模型R-FCN和FPN。同时,其效果优于目前最先进的级联(Cascade)R-CNN算法。展开更多
文本检测与文字识别技术是计算机视觉应用技术的重点研究方向,其中前者是后者的研究基础。文章探索了CTPN(Connectionist Text Proposal Network)技术在物流快递单文字识别任务中对文字检测的有效性和准确性。CTPN方法引入了垂直锚点机...文本检测与文字识别技术是计算机视觉应用技术的重点研究方向,其中前者是后者的研究基础。文章探索了CTPN(Connectionist Text Proposal Network)技术在物流快递单文字识别任务中对文字检测的有效性和准确性。CTPN方法引入了垂直锚点机制,结合CNN(Convolutional Neural Network)网络模型提取的空间特征与BLSTM(Bi-directional Long Short-Term Memory)神经网络模型提取的序列特征来提高文字检测精度。文章首先探讨了CTPN技术的相关原理,再构造快递单文字识别实验验证其对文字的检测能力。实验证明,CTPN技术能有效且准确地检测出快递单中的文字,为文字识别奠定基础。展开更多
文摘在解决目标检测任务的模型中,基于多阶段检测框架的模型相对单阶段和两阶段检测框架的模型具有明显的精度优势。该研究的主要目的是通过使用基于长短时记忆网络(Long Short Term Memory,LSTM)的多次迭代回归模块来改进广泛使用的两阶段回归框架。在该研究中,基于LSTM的候选框迭代优化模块被设计用来不断优化候选框生成网络(Region Proposal Network,RPN)所提出的候选框。该模块不仅能够灵活的与各种框架进行集成,同时还可以根据训练和测试阶段对检测速度需求的不同而任意的配置迭代次数。为了验证该方法的有效性,该研究采用基于ResNet-50和ResNet-101为主干网络的多个检测框架,并在两个公开数据集上进行了大量实验。结果表明,该方法得到的所有类平均精度(mean Average Procession,mAP)明显高于基准模型R-FCN和FPN。同时,其效果优于目前最先进的级联(Cascade)R-CNN算法。
文摘文本检测与文字识别技术是计算机视觉应用技术的重点研究方向,其中前者是后者的研究基础。文章探索了CTPN(Connectionist Text Proposal Network)技术在物流快递单文字识别任务中对文字检测的有效性和准确性。CTPN方法引入了垂直锚点机制,结合CNN(Convolutional Neural Network)网络模型提取的空间特征与BLSTM(Bi-directional Long Short-Term Memory)神经网络模型提取的序列特征来提高文字检测精度。文章首先探讨了CTPN技术的相关原理,再构造快递单文字识别实验验证其对文字的检测能力。实验证明,CTPN技术能有效且准确地检测出快递单中的文字,为文字识别奠定基础。