期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种复杂文本图像中快速文本行检测算法 被引量:1
1
作者 肖人岳 秦慕婷 《科学技术与工程》 2008年第23期6253-6257,共5页
图像中的文本常常包含许多对图像理解,图像处理有用的信息,因此文本检测和提取被应用到很多应用当中如文档分割,文本修复,机器视觉,车牌检测与识别等。提出了一种基于游程分析的快速检测文本的算法,算法对图像中水平黑,白游程进行分析,... 图像中的文本常常包含许多对图像理解,图像处理有用的信息,因此文本检测和提取被应用到很多应用当中如文档分割,文本修复,机器视觉,车牌检测与识别等。提出了一种基于游程分析的快速检测文本的算法,算法对图像中水平黑,白游程进行分析,把同一文本区域中的空白填满(变黑),而把文本行间过长的笔画切断,然后做基于游程的连通域分析,再根据三条基于文本特征的判断准则进行筛选得到文本行区域。实验证明,该算法可以同时提取不同字体,字号,语种的文本行,并且对Logo,条形码等非文本准确判定。 展开更多
关键词 文本图像分析 游程分析 文本行检测 文本特征
下载PDF
一种基于梯度差的文档图像文本行检测算法 被引量:2
2
作者 王丹 王希常 杨侠 《微型机与应用》 2011年第18期32-34,37,共4页
在分析文本行特点的基础上,提出了一种利用水平梯度差进行文档图像的文本行检测算法。该算法首先对输入的文档图像进行水平梯度差计算,然后在局部窗口中求解最大梯度差并进行文本行区域的合并,通过非文本区域过滤来消除字符阶跃的跳变,... 在分析文本行特点的基础上,提出了一种利用水平梯度差进行文档图像的文本行检测算法。该算法首先对输入的文档图像进行水平梯度差计算,然后在局部窗口中求解最大梯度差并进行文本行区域的合并,通过非文本区域过滤来消除字符阶跃的跳变,最后将文档图像以行块的形式进行显示。实验结果表明,与投影算法进行相比,该算法对于行间距较小的文档图像的检测效果较好,时间复杂度较低并且检测的正确率较高,具有一定的鲁棒性和较好的适应性。 展开更多
关键词 梯度差 文本行检测 局部窗口 投影算法
下载PDF
APSENet:一种基于实例分割网络的满文档案文本行检测方法 被引量:2
3
作者 赫欣 李厚杰 +2 位作者 周瑜 郑蕊蕊 贺建军 《中央民族大学学报(自然科学版)》 2022年第1期19-27,共9页
文本行检测是满文档案数字化的重要环节,目前相关研究较少,特别是在长文本检测方面。本文借鉴PSENet图像实例分割模型,提出了APSENet的满文档案文本行检测方法。该方法使用Res Net网络提取满文档案文本行特征,通过引入渐进式尺度扩展算... 文本行检测是满文档案数字化的重要环节,目前相关研究较少,特别是在长文本检测方面。本文借鉴PSENet图像实例分割模型,提出了APSENet的满文档案文本行检测方法。该方法使用Res Net网络提取满文档案文本行特征,通过引入渐进式尺度扩展算法用于后处理网络输出的分割mask,可以有效解决长文本难以检测的问题,通过引入特征通道注意力机制,可以解决由无关背景干扰引起的文本框边距较大问题。实验结果表明,该算法可以取得较好的检测效果。 展开更多
关键词 满文档案 文本行检测 注意力机制 渐进式尺度扩展
下载PDF
基于文本域分割和文本行检测的扭曲文档图像校正
4
作者 张再银 童立靖 +1 位作者 湛健 沈冲 《电脑与信息技术》 2015年第1期13-15,共3页
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要。文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的... 针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要。文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的上、下、左、右边界,通过这些边界的联系检测出文本行;其次根据文本行首个连通域检测出校正基准线;最后根据校正基线和垂直位移距离分别对文字进行位移而得到校正后的图像,从而可以被光学字符识别软件识别。 展开更多
关键词 文本域分割 文本行检测 扭曲恢复
下载PDF
基于深度学习的模板化手写表单信息提取方法
5
作者 董前前 陈亮 王鑫鑫 《计算机技术与发展》 2024年第10期204-212,共9页
手写纸质表单作为制造企业各部门之间信息传递的重要数据载体,其关键信息的提取对于企业生产、管理和决策具有重要意义。然而,当前手写表单信息提取方案在复杂文本布局中很难准确快速地抽取关键信息。为解决这一问题,提出了一种两阶段... 手写纸质表单作为制造企业各部门之间信息传递的重要数据载体,其关键信息的提取对于企业生产、管理和决策具有重要意义。然而,当前手写表单信息提取方案在复杂文本布局中很难准确快速地抽取关键信息。为解决这一问题,提出了一种两阶段的模板化手写表单信息提取方法,仅需一张图片即可完成模板搭建,聚焦于用户关心的信息,并规避了传统关系抽取任务在复杂表格中潜在的逻辑错误。首先,对于一个特定种类的表格图片,直接在图像上标注希望识别的区域,并为这些区域分配对应的key值。然后,采用高分辨率网络提高对小文本的检测精确率,并提出多分辨率均匀分割的混洗的策略使得检测模型在性能和参数都取得良好表现。同时引入时域卷积网络和自注意力机制使得识别模型能够较好地应对手写字体由于书写速度和书写工具的原因造成的字迹模糊、不清晰和笔画缺失等情况。识别完成后,系统将识别结果与预设的key值进行绑定,形成结构化的输出。实验结果表明,与典型ResNet50模型相比,在模型参数几乎相等的情况下,小文本检测准确性提升15.8百分点。文本识别任务中,模型在CASIA-HWDB2.0-2.2数据集上的字符准精确率可达99.30%。在文本框未完全涵盖整个文本行的情况下,字符准精确率仅下降0.55百分点,表明文本识别模型具有较好的鲁棒性。 展开更多
关键词 信息提取 手写表单 基于模板 手写文字识别 文本行检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部