期刊文献+
共找到96篇文章
< 1 2 5 >
每页显示 20 50 100
CNN and Fuzzy Rules Based Text Detection and Recognition from Natural Scenes
1
作者 T.Mithila R.Arunprakash A.Ramachandran 《Computer Systems Science & Engineering》 SCIE EI 2022年第9期1165-1179,共15页
In today’s real world, an important research part in image processing isscene text detection and recognition. Scene text can be in different languages,fonts, sizes, colours, orientations and structures. Moreover, the... In today’s real world, an important research part in image processing isscene text detection and recognition. Scene text can be in different languages,fonts, sizes, colours, orientations and structures. Moreover, the aspect ratios andlayouts of a scene text may differ significantly. All these variations appear assignificant challenges for the detection and recognition algorithms that are consideredfor the text in natural scenes. In this paper, a new intelligent text detection andrecognition method for detectingthe text from natural scenes and forrecognizingthe text by applying the newly proposed Conditional Random Field-based fuzzyrules incorporated Convolutional Neural Network (CR-CNN) has been proposed.Moreover, we have recommended a new text detection method for detecting theexact text from the input natural scene images. For enhancing the presentation ofthe edge detection process, image pre-processing activities such as edge detectionand color modeling have beenapplied in this work. In addition, we have generatednew fuzzy rules for making effective decisions on the processes of text detectionand recognition. The experiments have been directedusing the standard benchmark datasets such as the ICDAR 2003, the ICDAR 2011, the ICDAR2005 and the SVT and have achieved better detection accuracy intext detectionand recognition. By using these three datasets, five different experiments havebeen conducted for evaluating the proposed model. And also, we have comparedthe proposed system with the other classifiers such as the SVM, the MLP and theCNN. In these comparisons, the proposed model has achieved better classificationaccuracywhen compared with the other existing works. 展开更多
关键词 CRF RULES text detection text recognition natural scene images CR-CNN
下载PDF
Embedded System Based Raspberry Pi 4 for Text Detection and Recognition
2
作者 Turki M.Alanazi 《Intelligent Automation & Soft Computing》 SCIE 2023年第6期3343-3354,共12页
Detecting and recognizing text from natural scene images presents a challenge because the image quality depends on the conditions in which the image is captured,such as viewing angles,blurring,sensor noise,etc.However... Detecting and recognizing text from natural scene images presents a challenge because the image quality depends on the conditions in which the image is captured,such as viewing angles,blurring,sensor noise,etc.However,in this paper,a prototype for text detection and recognition from natural scene images is proposed.This prototype is based on the Raspberry Pi 4 and the Universal Serial Bus(USB)camera and embedded our text detection and recognition model,which was developed using the Python language.Our model is based on the deep learning text detector model through the Efficient and Accurate Scene Text Detec-tor(EAST)model for text localization and detection and the Tesseract-OCR,which is used as an Optical Character Recognition(OCR)engine for text recog-nition.Our prototype is controlled by the Virtual Network Computing(VNC)tool through a computer via a wireless connection.The experiment results show that the recognition rate for the captured image through the camera by our prototype can reach 99.75%with low computational complexity.Furthermore,our proto-type is more performant than the Tesseract software in terms of the recognition rate.Besides,it provides the same performance in terms of the recognition rate with a huge decrease in the execution time by an average of 89%compared to the EasyOCR software on the Raspberry Pi 4 board. 展开更多
关键词 text detection text recognition OCR engine natural scene images Raspberry Pi USB camera
下载PDF
深度学习的自然场景文本识别方法综述 被引量:1
3
作者 曾凡智 冯文婕 周燕 《计算机科学与探索》 CSCD 北大核心 2024年第5期1160-1181,共22页
自然场景文本识别在学术研究和实际应用中具有重要价值,已经成为计算机视觉领域的研究热点之一。然而,识别过程存在文本风格多样、背景环境复杂等挑战,导致识别效率和准确率不佳。传统的基于手工设计特征文本识别方法由于其有限的表示能... 自然场景文本识别在学术研究和实际应用中具有重要价值,已经成为计算机视觉领域的研究热点之一。然而,识别过程存在文本风格多样、背景环境复杂等挑战,导致识别效率和准确率不佳。传统的基于手工设计特征文本识别方法由于其有限的表示能力,不足以有效地应对复杂的自然场景文本识别任务。近年来,采用深度学习方法在自然场景文本识别中取得了重大进展,系统地梳理了近年来相关研究工作。首先,根据是否需要对单字符进行分割,将自然场景文本识别方法分为基于分割与无需分割的方法,再根据其技术实现特点将无需分割的方法进行细分,并对各类最具有代表性的方法工作原理进行了阐述。然后,介绍了当前常用数据集以及评价指标,并在数据集上对各类方法进行了性能对比,从多个方面讨论了各类方法的优势与局限性。最后,指出基于深度学习的自然场景文本识别研究存在的不足和难点,对其未来的发展趋势进行了展望。 展开更多
关键词 文本识别 深度学习 自然场景
下载PDF
基于深度学习的自然场景文本检测综述 被引量:2
4
作者 连哲 殷雁君 +1 位作者 云飞 智敏 《计算机工程》 CAS CSCD 北大核心 2024年第3期16-27,共12页
基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和... 基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。 展开更多
关键词 深度学习 计算机视觉 自然场景文本 文本检测 多方向文本检测 多尺度文本检测
下载PDF
一种基于信息熵迁移的文本检测模型自蒸馏方法
5
作者 陈建炜 杨帆 赖永炫 《自动化学报》 EI CAS CSCD 北大核心 2024年第11期2128-2139,共12页
前沿的自然场景文本检测方法大多基于全卷积语义分割网络,利用像素级分类结果有效检测任意形状的文本,其主要缺点是模型大、推理时间长、内存占用高,这在实际应用中限制了其部署.提出一种基于信息熵迁移的自蒸馏训练方法(Self-distillat... 前沿的自然场景文本检测方法大多基于全卷积语义分割网络,利用像素级分类结果有效检测任意形状的文本,其主要缺点是模型大、推理时间长、内存占用高,这在实际应用中限制了其部署.提出一种基于信息熵迁移的自蒸馏训练方法(Self-distillation via entropy transfer,SDET),利用文本检测网络深层网络输出的分割图(Segmentation map,SM)信息熵作为待迁移知识,通过辅助网络将信息熵反馈给浅层网络.与依赖教师网络的知识蒸馏(Knowledge distillation,KD)不同,SDET仅在训练阶段增加一个辅助网络,以微小的额外训练代价实现无需教师网络的自蒸馏(Self-distillation,SD).在多个自然场景文本检测的标准数据集上的实验结果表明,SDET在基线文本检测网络的召回率和F1得分上,能显著优于其他蒸馏方法. 展开更多
关键词 自然场景 文本检测 知识蒸馏 自蒸馏 信息熵
下载PDF
基于深度学习的场景文字识别技术研究
6
作者 陈志宇 司占军 朱新雨 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第3期237-243,291,共8页
基于深度学习的场景文字识别技术(Scene Text Recognition,STR)应用广泛但性能尚需提升。针对现有的STR技术对小目标文字识别不准确和中文、中英文混合准确率低的问题,通过改进模型增加104×104的特征尺度,用Focal Loss和GIOU Loss... 基于深度学习的场景文字识别技术(Scene Text Recognition,STR)应用广泛但性能尚需提升。针对现有的STR技术对小目标文字识别不准确和中文、中英文混合准确率低的问题,通过改进模型增加104×104的特征尺度,用Focal Loss和GIOU Loss作为损失函数来优化目标检测框,将卷积块注意力模块(Convolutional Block Attention Module,CBAM)嵌入到卷积层中,使网络在特定位置和通道上更加关注目标,抑制其余复杂背景信息以此来提高模型的文字检测能力;分析中文的文字特征,对CRNN的特征提取网络改进优化,提高了原有模型对中文、中英文混合识别的准确性。实验结果表明,通过对文字检测与识别模型和算法的改进优化,大大提高了场景文字识别技术的准确性和鲁棒性。 展开更多
关键词 深度学习 场景文字识别技术 图像处理 目标检测 文字识别
下载PDF
嵌入拓扑特征的自然场景文本检测方法
7
作者 郑侠聪 程良伦 +1 位作者 黄国恒 王敬超 《广东工业大学学报》 CAS 2024年第3期102-109,共8页
传统的基于锚点框(anchor box)实现的自然场景文本检测方法中,锚点框容易受到其他文本实例的干扰产生误判或精度降低,且文本实例包含强烈的拓扑特征但并未得到重视,导致在弯曲环形文本检测任务中表现不佳。针对这个问题提出了一种新颖... 传统的基于锚点框(anchor box)实现的自然场景文本检测方法中,锚点框容易受到其他文本实例的干扰产生误判或精度降低,且文本实例包含强烈的拓扑特征但并未得到重视,导致在弯曲环形文本检测任务中表现不佳。针对这个问题提出了一种新颖的神经网络结构,引入图卷积神经网络的概念,充分考虑邻近锚点框之间的联系,并融入锚点框的拓扑特征辅助图神经网络的学习,提高整体网络的有效性。在两个公开的自然场景文本检测数据集上进行了消融实验,在公开数据集CTW1500中,本文提出的方法使模型在召回率、精确率、F分数这3个指标上分别提高了3.0%、1.9%以及2.5%,在公开数据集Totel-Text中这3个指标分别是2.2%、1.8%以及2.0%。此外,本文方法还与近年提出的其他文本检测算法进行了比较,实验结果证明本文提出的方法在复杂自然场景下文本检测效果优秀,所提出的模块有利于文本检测性能的提高。 展开更多
关键词 文本检测 自然场景 图神经网络 拓扑特征
下载PDF
基于改进MTSv2的场景文本检测和识别算法研究
8
作者 王艳媛 茅正冲 杨雨涵 《计算机测量与控制》 2024年第9期256-261,共6页
在自然场景图像中,丰富的文本内容对于全面理解场景非常重要。针对自然场景文本图像存在背景复杂、文本粘连、文本多角度等问题,提出一种基于改进MTSv2的文本检测和识别算法;检测算法以MTSv2为基础网络,采用CBAM注意力机制增大特征图中... 在自然场景图像中,丰富的文本内容对于全面理解场景非常重要。针对自然场景文本图像存在背景复杂、文本粘连、文本多角度等问题,提出一种基于改进MTSv2的文本检测和识别算法;检测算法以MTSv2为基础网络,采用CBAM注意力机制增大特征图中的小型文本的权重,更好捕捉图像中的关键特征;融合CE-FPN结构,减轻多尺度融合产生的特征混叠问题;引入focal loss函数,减少正负样本分布不均衡对识别准确率的影响,使网络更加关注难以分类的样本,改善模型的泛化能力;通过多个文本数据集进行训练,并在ICDAR2015数据集上进行验证,改进后模型对场景文本检测和识别的准确率达到了89.3%,召回率达到了87.6%,F_(1)值达到了88.5%,相比于原模型都有一定程度的提高。 展开更多
关键词 场景文本 文本检测 文本识别 CBAM CE-FPN 注意力机制
下载PDF
场景图像弯曲文本检测与识别
9
作者 刘航源 《计算机与数字工程》 2024年第6期1848-1853,共6页
随着深度学习技术的发展,场景文本检测与识别在近几年取得了巨大的进步,场景文本检测与识别的实现方式也越来越具有多样性。然而,场景文本的表示方式仍然以矩形和旋转矩形居多,该类文本表示方式难以精准表示弯曲的文本实例。为了解决弯... 随着深度学习技术的发展,场景文本检测与识别在近几年取得了巨大的进步,场景文本检测与识别的实现方式也越来越具有多样性。然而,场景文本的表示方式仍然以矩形和旋转矩形居多,该类文本表示方式难以精准表示弯曲的文本实例。为了解决弯曲文本的表示问题,论文提出了一种参数化的弯曲文本表示法,并且基于参数化表示法设计了弯曲文本纠正算法,实现了弯曲文本的形态纠正,降低了识别的难度。通过引入该方法,实现了功能完善的场景文本检测与识别系统。实验结果表明,此方法可以有效完成场景文本的检测与识别任务。 展开更多
关键词 场景文本检测 文本识别 弯曲文本 形态纠正
下载PDF
基于增强多层次特征融合的自然场景文本检测
10
作者 周燕 韦勤彬 +3 位作者 廖俊玮 曾凡智 刘翔宇 周月霞 《佛山科学技术学院学报(自然科学版)》 CAS 2024年第3期1-13,共13页
针对自然场景图像中未聚焦小文本、复杂背景文本以及宽间距弯曲文本等造成的检测难题,提出了一种基于增强多层次特征融合的自然场景文本检测方法,该方法包括局部注意力特征增强(Local Attention Feature Enhanced,LAFE)模块和多层次增... 针对自然场景图像中未聚焦小文本、复杂背景文本以及宽间距弯曲文本等造成的检测难题,提出了一种基于增强多层次特征融合的自然场景文本检测方法,该方法包括局部注意力特征增强(Local Attention Feature Enhanced,LAFE)模块和多层次增强特征融合(Multi-level Enhanced Feature Fused,MEFF)模块。LAFE模块通过堆叠空洞卷积扩大网络感受野,结合通道与空间注意力来增强像素点分类能力;MEFF模块作为多层次增强特征连接分支,引入可变形卷积来增强特征图之间的信息融合。实验结果表明,所提方法在常用文本数据集上取得了较好的性能,其中,在ICDAR2015、Total-Text数据集上的综合指标F分别达到了88.1%和86.5%,相比原方法分别提升了0.8%和1.8%。 展开更多
关键词 自然场景文本检测 注意力机制 像素点分类 空洞卷积 特征融合
下载PDF
基于Deformable DETR的自然场景任意形状文本检测
11
作者 张子旭 游钰玮 +1 位作者 仝明磊 薛亮 《无线电工程》 2024年第2期312-318,共7页
自然场景下的文本区域形状复杂多变,直接使用轮廓坐标描述文本区域会使得建模不充分,导致文本检测准确性低。针对自然场景下文本区域不规则的问题,提出了一种基于Deformable DETR的任意形状文本检测模型,不同于传统的直接预测轮廓点的方... 自然场景下的文本区域形状复杂多变,直接使用轮廓坐标描述文本区域会使得建模不充分,导致文本检测准确性低。针对自然场景下文本区域不规则的问题,提出了一种基于Deformable DETR的任意形状文本检测模型,不同于传统的直接预测轮廓点的方法,使用B-样条对文字区域进行建模使得文本轮廓平滑精确的同时减少了需要预测的参数。提出的文本检测模型无需手工设计锚点、区域建议等组件,极大地简化了模型设计并提高了通用性。提出的模型在无需额外数据集的情况下在任意形状文本数据集CTW1500和Total-Text上的平均精度(F值)分别达到了85.4%和85.0%,证明了模型的有效性。 展开更多
关键词 计算机视觉 自然场景文本检测 Deformable DETR B-样条
下载PDF
基于深度学习的自然场景文本检测与识别研究
12
作者 张蝶依 《移动信息》 2024年第6期245-247,共3页
自然场景文本检测与识别技术主要应用于自动驾驶、车牌识别、智能机器人等多个场景,实用价值高,研究前景广阔。然而,自然场景的背景复杂,增加了区分文本的难度,因此相比传统的用于印刷文本检测及识别的OCR技术,自然场景的文本检测与识... 自然场景文本检测与识别技术主要应用于自动驾驶、车牌识别、智能机器人等多个场景,实用价值高,研究前景广阔。然而,自然场景的背景复杂,增加了区分文本的难度,因此相比传统的用于印刷文本检测及识别的OCR技术,自然场景的文本检测与识别难度更高。文中提出了一种基于深度学习的自然场景文本检测与识别模型,其利用图像分割技术构建自然场景文本检测模型,并阐述了模型结构及组件。此外,还利用了压缩与激励神经网络技术来构建自然场景文本识别模型。 展开更多
关键词 深度学习 自然场景 文本检测与识别 图像分割
下载PDF
自然场景文本检测与端到端识别:深度学习方法 被引量:8
13
作者 周燕 韦勤彬 +4 位作者 廖俊玮 曾凡智 冯文婕 刘翔宇 周月霞 《计算机科学与探索》 CSCD 北大核心 2023年第3期577-594,共18页
自然场景图像中丰富的文本内容对场景理解有着重要意义,但自然场景文本往往具有极端横纵比、字体风格多变、背景及形状复杂等特点,而传统的文本检测与端到端识别方法存在着模型设计复杂、效率低、适用性不强且耗费成本高等缺点。随着深... 自然场景图像中丰富的文本内容对场景理解有着重要意义,但自然场景文本往往具有极端横纵比、字体风格多变、背景及形状复杂等特点,而传统的文本检测与端到端识别方法存在着模型设计复杂、效率低、适用性不强且耗费成本高等缺点。随着深度学习技术在图像领域的迅速发展,自然场景文本检测与端到端识别方法取得了突破性的进展,其性能和效率得到了显著提高。针对自然场景文本检测与端到端识别方法,梳理了近年来相关的研究工作。首先,根据文本框生成方式的不同,主要从回归候选框和像素分割两个角度来划分自然场景文本检测方法的基本思想,并对各类代表性的方法进行了详细叙述;其次,从端到端识别速度与解耦检测和识别任务的角度对端到端识别方法的技术发展路线进行了归纳总结;然后,介绍了常用的公开文本数据集,并在公开的文本数据集上对各类方法进行了性能对比;最后,对自然场景文本检测与端到端识别的主流研究方向进行了讨论,并阐述了其面临的挑战和未来的发展趋势。 展开更多
关键词 深度学习 自然场景 文本检测 端到端识别
下载PDF
深度卷积网络的自然场景文本检测研究综述
14
作者 宋传鸣 王一琦 +3 位作者 武惠娟 何熠辉 洪飏 王相海 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1996-2008,共13页
自然场景文本检测是从场景图像中获取文本信息的重要手段,但是仍旧面临背景复杂、文字种类丰富、排列方向多样、文本行组成复杂等因素的严峻挑战.研究检测精度高、通用性强、稳健性好的自然场景文本检测方法是目前计算机视觉领域的热点... 自然场景文本检测是从场景图像中获取文本信息的重要手段,但是仍旧面临背景复杂、文字种类丰富、排列方向多样、文本行组成复杂等因素的严峻挑战.研究检测精度高、通用性强、稳健性好的自然场景文本检测方法是目前计算机视觉领域的热点问题之一.并且,基于深度卷积网络的自然场景文本检测方法逐渐成为主流.因此,从自然场景文本检测技术的研究背景及主要挑战切入,根据骨干网络的不同将现有方法划分为基于VGG网络的文本检测方法、基于残差网络的文本检测方法和基于特征金字塔网络的文本检测方法,重点阐述各类方法的核心思想、技术优势及其不足;然后,总结自然场景文本检测的公共数据集,对代表性方法的检测性能进行客观比较;最后,梳理和总结自然场景文本检测技术的难点并展望其未来发展趋势. 展开更多
关键词 文本检测 自然场景文本 综述 深度学习 深度卷积网络
下载PDF
基于注意力机制与深度多尺度特征融合的自然场景文本检测 被引量:3
15
作者 李雨 闫甜甜 +1 位作者 周东生 魏小鹏 《图学学报》 CSCD 北大核心 2023年第3期473-481,共9页
针对现有场景文本检测方法不能深入挖掘并充分融合多尺度文本实例判别性特征的问题,提出一种基于注意力机制与深度多尺度特征融合的自然场景文本检测方法。首先采用带有注意力增强的ResNeSt50作为骨干网络,提取文本实例在不同尺度上更... 针对现有场景文本检测方法不能深入挖掘并充分融合多尺度文本实例判别性特征的问题,提出一种基于注意力机制与深度多尺度特征融合的自然场景文本检测方法。首先采用带有注意力增强的ResNeSt50作为骨干网络,提取文本实例在不同尺度上更具判别力的特征表示;然后设计深度多尺度特征融合模块,将不同尺度的特征信息进行交互,自适应地学习不同尺度特征图对应的权重矩阵,用于融合文本实例在不同尺度特征图上具有判别力的特征信息,从而获得更具鲁棒性的多尺度融合特征图;最后利用自适应的二值化后处理模块生成更加精确的文本区域边界框。为评估其有效性,大量实验在ICDAR2015,ICDAR2013和CTW1500数据集上进行验证,结果表明该方法相较于其他先进的检测方法取得了有竞争力的检测结果,展现出良好的鲁棒性和泛化能力。 展开更多
关键词 自然场景文本检测 注意力机制 多尺度特征融合 二值化 自适应
下载PDF
嵌入重评分机制的自然场景文本检测方法
16
作者 刘艳丽 王毅宏 +1 位作者 张恒 程晶晶 《计算机仿真》 北大核心 2023年第2期228-235,302,共9页
针对自然场景文本检测中存在大量假阳性问题,提出了嵌入重评分机制的自然场景文本检测方法。引入实例分割网络(Mask R-CNN)作为基本框架,实现对自然场景中多方向、不规则文本的检测;设计文本掩膜重评分机制,通过预测文本掩膜的质量,将... 针对自然场景文本检测中存在大量假阳性问题,提出了嵌入重评分机制的自然场景文本检测方法。引入实例分割网络(Mask R-CNN)作为基本框架,实现对自然场景中多方向、不规则文本的检测;设计文本掩膜重评分机制,通过预测文本掩膜的质量,将文本的语义类别信息与其对应的掩膜完整性信息相结合,重新评估文本掩膜的质量,精确了文本的候选区域;重新设计损失函数的作用范围。上述模型基于端到端训练,在ICDAR2013、ICDAR2015和Total-Text等数据集进行性能测试,结果表明,提出的方法有效的提高了字符分割的完整性,较之现有方法明显地提高了文本检测的准确率和召回率,更适合自然场景中的不规则文本的识别。 展开更多
关键词 文本检测 文本识别 自然场景 实例分割
下载PDF
基于深度学习的场景图像自适应文本检测方法
17
作者 杨仁桓 康家杰 +3 位作者 秦传波 麦超云 邱天 喻慧文 《现代电子技术》 2023年第16期143-148,共6页
为了解决自然场景图像中任意形状文本检测的难题,文中提出一种具有自适应文本区域表示的鲁棒场景文本检测方法;同时基于回归和分割方法的两种思想,设计自适应角点检测模块(ACDM)和自适应阈值分割模块(ATSM)。将不同尺度的文本生成不同... 为了解决自然场景图像中任意形状文本检测的难题,文中提出一种具有自适应文本区域表示的鲁棒场景文本检测方法;同时基于回归和分割方法的两种思想,设计自适应角点检测模块(ACDM)和自适应阈值分割模块(ATSM)。将不同尺度的文本生成不同数量的角点进行定位,利用自适应阈值的方法生成文本分割图,结合生成的角点候选框进行联合优化。实验结果表明:所提方法在ICDAR2015数据集上综合指标F为86.5%,相较于PSENet网络提升0.8%;在Total-Text和CTW1500数据集上综合指标F分别为85.3%和84.2%,相较于DBNet网络分别提升0.6%和0.8%。该方法能有效提高任意形状文本检测的鲁棒性。 展开更多
关键词 自适应文本检测 自然场景图像 深度学习 自适应角点检测 自适应阈值分割 ResNet-50网络 特征金字塔网络(FPN)
下载PDF
自然场景文本快速检测识别方法
18
作者 燕天 《探测与控制学报》 CSCD 北大核心 2023年第3期126-133,共8页
针对基于卷积循环神经网络或实例分割的自然场景文本图像检测识别方法结构复杂、实时性差、鲁棒性低的问题,提出基于改进Faster RCNN和高斯混合模型(GMM)的文本图像快速检测识别方法。该方法首先使用改进的Faster RCNN模型进行单字符检... 针对基于卷积循环神经网络或实例分割的自然场景文本图像检测识别方法结构复杂、实时性差、鲁棒性低的问题,提出基于改进Faster RCNN和高斯混合模型(GMM)的文本图像快速检测识别方法。该方法首先使用改进的Faster RCNN模型进行单字符检测识别并求出图中文本区域的数量,然后使用高斯混合模型进行单字符聚类并构造出候选的多边形文本框,最后使用重定义的置信度公式筛选出适当的文本区域边框,并输出边框内的字符标签序列。公共数据集的测试结果表明,该方法具有良好的鲁棒性和实时性。 展开更多
关键词 自然场景文本检测识别 改进的Faster RCNN 高斯混合模型 鲁棒性 实时性
下载PDF
注意力机制与自适应尺度融合的场景文本检测
19
作者 梁雨欣 毕晓君 《应用科技》 CAS 2023年第1期45-50,111,共7页
在场景文本检测任务中,由于图像背景复杂、文本实例尺度不一等问题,导致现有模型的文本检测精度不高。为此,本文设计了一种基于注意力机制与自适应尺度融合的场景文本检测模型。首先,通过引入高效通道注意力机制,提高了特征提取网络的... 在场景文本检测任务中,由于图像背景复杂、文本实例尺度不一等问题,导致现有模型的文本检测精度不高。为此,本文设计了一种基于注意力机制与自适应尺度融合的场景文本检测模型。首先,通过引入高效通道注意力机制,提高了特征提取网络的表征能力,降低了文字的漏检率和误报率;其次,通过设计自适应尺度融合模块,动态融合不同尺度特征,增强了模型对不同尺度文本实例的检测和定位能力。实验结果表明,本文提出的模型在Total-Text和MSRATD500共2个数据集上的F综合指标分别达到85.1%和84.1%,在同类型算法中处于领先水平。 展开更多
关键词 场景文本检测 任意形状文本 注意力机制 自适应尺度融合 概率图 向心偏移图 深度学习 自然场景
下载PDF
融合CTPN和CRNN模型的自然场景文本检测与识别方法
20
作者 徐舫 张小庆 《保山学院学报》 2023年第2期60-67,共8页
针对自然场景中文本检测与识别存在准确率不高和效率不佳的问题,提出了一种融合场景文本检测CTPN和卷积循环神经网络CRNN模型的自然场景文字检测与识别方法。首先利用CTPN模型对文本行进行预测,再利用卷积神经网络进行特征序列提取和识... 针对自然场景中文本检测与识别存在准确率不高和效率不佳的问题,提出了一种融合场景文本检测CTPN和卷积循环神经网络CRNN模型的自然场景文字检测与识别方法。首先利用CTPN模型对文本行进行预测,再利用卷积神经网络进行特征序列提取和识别并基于Bi-LSTM学习序列特征,最后将文本分数高的窗口连接作为文本区域,从而实现文本检测。实验结果表明,在ICADR-2013数据集中改进模型的准确率可达78%;基于CRNN的文本识别模型在提取特征序列后,经过转录层预测的文本序列结果,在测试集上的准确率可达到86.7%;以上结果表明融合CTPN和CRNN模型的自然场景文字检测与识别方法能够获得更好的检测与识别效果。 展开更多
关键词 文本检测 文本识别 卷积循环神经网络 场景文本检测算法
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部