期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
注意力机制在自然场景文字检测中的应用 被引量:8
1
作者 王延昭 顾晓东 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第12期1908-1915,共8页
针对目前主流的基于分割的文字检测方法中由于需要复杂的后处理过程保证检测精度,通常难以实现高检测速度的问题,提出一种应用位置注意力模块和金字塔注意力网络2种注意力机制的方法.首先用金字塔注意力网络对图像进行特征提取及语义分... 针对目前主流的基于分割的文字检测方法中由于需要复杂的后处理过程保证检测精度,通常难以实现高检测速度的问题,提出一种应用位置注意力模块和金字塔注意力网络2种注意力机制的方法.首先用金字塔注意力网络对图像进行特征提取及语义分割;同时将位置注意力模块应用于高层特征,通过加强图像中相似物体的权重加强对文字的检测效果;最后进行简单有效的后处理,在实现较高检测准确度的前提下提高检测速度.实验结果表明,在Total-text数据集中,采用更轻量化的骨干网络时,所提方法在检测速度上优势明显;采用更深层的骨干网络时,所提方法的检测准确度领先2.0%. 展开更多
关键词 自然场景文字检测 神经网络 金字塔注意力网络 位置注意力机制
下载PDF
基于FCN的多方向自然场景文字检测方法 被引量:13
2
作者 杨剑锋 王润民 +2 位作者 何璇 李秀梅 钱盛友 《计算机工程与应用》 CSCD 北大核心 2020年第2期164-170,共7页
传统的自然场景文字检测方法所采用的手工设计特征在应对复杂自然场景时缺乏鲁棒性。针对复杂自然场景中的多方向文字检测问题,提出了一种新的基于深度学习文字检测方法,采用全卷积网络(Fully Convolutional Networks,FCN)并融合多尺度... 传统的自然场景文字检测方法所采用的手工设计特征在应对复杂自然场景时缺乏鲁棒性。针对复杂自然场景中的多方向文字检测问题,提出了一种新的基于深度学习文字检测方法,采用全卷积网络(Fully Convolutional Networks,FCN)并融合多尺度文字特征图,结合语义分割的方法分割文字候选区域,利用分割得到的文字候选区域直接获取文字候选检测框并进行扩大补偿处理,对文字候选检测框进行后处理得到最终检测结果。该方法在ICDAR2013、ICDAR2015标准数据集进行了测评,实验结果表明该方法相比一些最新方法取得了更好的性能。 展开更多
关键词 自然场景文字检测 深度学习 全卷积网络 语义分割
下载PDF
基于质心感知的自然场景文字检测技术 被引量:1
3
作者 张高明 《科技与创新》 2022年第8期166-168,共3页
针对自然场景文字检测[1]准确率较低的问题,在常规文字检测的多任务网络结构基础上进行优化设计,在文本分类任务中增加文字实例质心预测分支,采用质心计算方法对网络进行训练,联合传统网络中分类结果和回归预测结果,增大靠近文字实例中... 针对自然场景文字检测[1]准确率较低的问题,在常规文字检测的多任务网络结构基础上进行优化设计,在文本分类任务中增加文字实例质心预测分支,采用质心计算方法对网络进行训练,联合传统网络中分类结果和回归预测结果,增大靠近文字实例中心处的分类预测值,减小远离中心处的分类预测值,提升模型整体准确率。实验部分,在标准数据集Total-Text中进行的对比测试结果表明,增加质心预测分支后网络的准确率得到了明显提升。 展开更多
关键词 多任务学习 深度学习 质心检测 自然场景文字
下载PDF
自然场景图像中的文字检测综述 被引量:12
4
作者 杨飞 《电子设计工程》 2016年第24期165-168,共4页
近年来自然场景图像中的文字检测与识别越来越得到人们的关注,主要是因为图像中的文字检测与识别对于理解图片内容、建立图像索引具有重要的意义。本文针对图像文字检测与识别这一领域的核心的问题即文字检测与定位,首先通过介绍了图像... 近年来自然场景图像中的文字检测与识别越来越得到人们的关注,主要是因为图像中的文字检测与识别对于理解图片内容、建立图像索引具有重要的意义。本文针对图像文字检测与识别这一领域的核心的问题即文字检测与定位,首先通过介绍了图像中的文字检测的基本概念,然后通过介绍和对比各种图像文字检测的方法的优缺点,我们可以得出这样一个结论即结合深度学习方法和大数据来进行自然场景图像文字检测与识别已经成为一个趋势和热点,文章最后总结了该领域的挑战和最新的发展趋势。 展开更多
关键词 自然场景文字检测 文字识别 深度学习方法
下载PDF
适用于文字检测的候选框提取算法 被引量:2
5
作者 朱盈盈 张拯 +3 位作者 章成全 张兆翔 白翔 刘文予 《数据采集与处理》 CSCD 北大核心 2017年第6期1097-1106,共10页
在文字检测的相关研究中,针对文字的候选框提取方法并未得到广泛关注与深入挖掘。一方面由于文字本身结构和一般物体具有较强的差异性,另一方面由于文字对检测的精度要求高。本文提出了一种针对文字的候选框提取算法,该算法首先利用全... 在文字检测的相关研究中,针对文字的候选框提取方法并未得到广泛关注与深入挖掘。一方面由于文字本身结构和一般物体具有较强的差异性,另一方面由于文字对检测的精度要求高。本文提出了一种针对文字的候选框提取算法,该算法首先利用全卷积网络进行快速预测文字区域,有效地减少了候选框的搜索范围,然后针对文字特性对EdgeBox算法进行改进,使之适用于自然场景文字候选框的提取。此外,本文在两个自然场景文字检测的标准数据集上对该算法进行了评测,并与其他已有的候选框提取方法进行了比较。实验结果表明本文方法相较其他算法,具有更好的性能和鲁棒性。 展开更多
关键词 物体候选框 自然场景文字检测 全卷积网络 EdgeBox
下载PDF
基于K-means颜色聚类分割与边缘检测的文字提取 被引量:2
6
作者 吴春法 潘亚文 王敬 《电脑知识与技术》 2017年第10期206-207,210,共3页
针对自然场景中文字提取受复杂环境因素的影响,如光照不均匀、自然场景背景颜色多样等因素影响,采用任何单一的图像分割技术都无法进行有效地进行文字区域分割和文字提取,提出一种两种方法相结合的自然环境场景中的文字提取方法。首先,... 针对自然场景中文字提取受复杂环境因素的影响,如光照不均匀、自然场景背景颜色多样等因素影响,采用任何单一的图像分割技术都无法进行有效地进行文字区域分割和文字提取,提出一种两种方法相结合的自然环境场景中的文字提取方法。首先,采用实现颜色聚类的K-means算法对文本区域与有颜色背景分割,然后在文本区域内对文字进行二值化处理后运用边缘检测的方法提取文字。通过VC++编程环境及OpenCV技术作为该方法的验证平台,结果显示基于Kmeans算法实现颜色聚类与边缘检测方法相结合能有效进行自然环境中文字的提取。 展开更多
关键词 自然场景文字 边缘检测 K-MEANS 颜色聚类 连通分析 OPENCV
下载PDF
基于深度全卷积神经网络的文字区域定位方法 被引量:1
7
作者 骆遥 《无线互联科技》 2016年第23期43-44,共2页
近年来,深度学习模型在各种计算机视觉方面都展现出了远远优于传统方法的性能,在自然场景中的文字区域定位问题中引入深度学习方法无疑也是大势所趋。文章提出了一种基于深度全卷积网络方法的文字区域定位方法,实现了端到端的训练、检测... 近年来,深度学习模型在各种计算机视觉方面都展现出了远远优于传统方法的性能,在自然场景中的文字区域定位问题中引入深度学习方法无疑也是大势所趋。文章提出了一种基于深度全卷积网络方法的文字区域定位方法,实现了端到端的训练、检测,使得训练更为有效,检测过程更加高效。最终文中方法在ICDAR 2015数据集上对比基于MSER等的传统方法有了很大提升,达到了86.57%的查准率和82.1%的召回率。 展开更多
关键词 深度全卷积网络 自然场景文字区域定位 图像区域分割
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部