期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
一种自然场景图像的目标材质视觉特征映射算法 被引量:3
1
作者 李策 贾盛泽 曲延云 《自动化学报》 EI CSCD 北大核心 2019年第6期1198-1206,共9页
针对自然场景图像目标材质视觉特征映射中,尚存在特征提取困难、图像无对应标签等问题,本文提出了一种自然场景图像的目标材质视觉特征映射算法.首先,从图像中获取能表征材质视觉重要特征的反射层图像;然后,对获取的反射层图像进行前景... 针对自然场景图像目标材质视觉特征映射中,尚存在特征提取困难、图像无对应标签等问题,本文提出了一种自然场景图像的目标材质视觉特征映射算法.首先,从图像中获取能表征材质视觉重要特征的反射层图像;然后,对获取的反射层图像进行前景、背景分割,得到目标图像;最后,利用循环生成对抗网络对材质视觉特征进行无监督学习,获得对图像目标材质视觉特征空间的高阶表达,实现了目标材质视觉特征的映射.实验结果表明,所提算法能够有效地获取自然场景图像目标的材质视觉特征,并进行材质视觉特征映射;与同类算法相比,具有更好的主、客观效果. 展开更多
关键词 自然场景图像 材质视觉特征 特征映射 循环生成对抗网络
下载PDF
自然场景图像中的文本检测及定位算法研究——基于边缘信息与笔画特征 被引量:4
2
作者 李东勤 徐勇 周万怀 《重庆科技学院学报(自然科学版)》 CAS 2019年第3期81-83,共3页
鉴于自然场景图像中的文本具有较强的边缘信息,而汉字大多包含横竖笔画,提出了基于边缘信息与笔画特征的文本检测及定位方法。通过提取自然场景图像的边缘特征,运用数学形态学方法实现对断裂笔画的有效连接,从而形成候选文本区域;再利... 鉴于自然场景图像中的文本具有较强的边缘信息,而汉字大多包含横竖笔画,提出了基于边缘信息与笔画特征的文本检测及定位方法。通过提取自然场景图像的边缘特征,运用数学形态学方法实现对断裂笔画的有效连接,从而形成候选文本区域;再利用文本的笔画特征,实现文本与背景的分离;最后通过自定义规则,将相邻的候选文本块进行合并,同时去除不符合条件的候选文本块。测试结果显示,该方法的查全率为90.4%,误检率为15.6%。 展开更多
关键词 自然场景图像 文本检测 边缘特征 笔画特征 形态学方法
下载PDF
自然场景图像中的文本检测方法研究
3
作者 李东勤 王芳 周万怀 《重庆科技学院学报(自然科学版)》 CAS 2016年第6期108-111,共4页
研究自然场景中的文本检测与定位方法,总结文本检测的研究现状,并对主流算法进行了分类和对比。
关键词 自然场景图像 文本检测 文本定位 文本/非文本分类
下载PDF
自然场景图像中的文本信息提取研究
4
作者 李东勤 徐勇 《黑龙江科技信息》 2015年第36期131-133,共3页
自然场景中的文字提取技术成为了近几年计算机视觉领域的热门研究课题。本文对自然场景文本信息提取的关键技术进行了研究,全面总结了文本信息提取的研究现状,对文本检测定位和识别算法设计进行了有益的探索和研究,并对主流算法进行了... 自然场景中的文字提取技术成为了近几年计算机视觉领域的热门研究课题。本文对自然场景文本信息提取的关键技术进行了研究,全面总结了文本信息提取的研究现状,对文本检测定位和识别算法设计进行了有益的探索和研究,并对主流算法进行了分类和对比,最后总结了场景图像中文本信息提取存在的主要问题和评测方法。 展开更多
关键词 自然场景图像 文本信息提取 文本定位 文本识别
下载PDF
基于R2CNN的自然场景图像中文本检测方法 被引量:1
5
作者 沈伟生 《无线互联科技》 2019年第2期107-109,共3页
在互联网世界中,图片是传递信息的重要媒介。特别是电子商务、社交、搜索等领域,每天都有数以亿兆级别的图像在传播。自然场景就是我们所处的生活环境,自然场景图像中存在着大量的文本信息,例如路标信息、商店门店信息、商品包装信息等... 在互联网世界中,图片是传递信息的重要媒介。特别是电子商务、社交、搜索等领域,每天都有数以亿兆级别的图像在传播。自然场景就是我们所处的生活环境,自然场景图像中存在着大量的文本信息,例如路标信息、商店门店信息、商品包装信息等。随着深度学习的发展,基于深度学习的文本检测技术也逐渐流行起来。文章主要提出的是基于R2CNN的文本检测算法。在R2CNN算法的基础上对算法的结构进行改进,最终算法在ICDAR2015数据集上的召回率为87.2%,精确率为81.43%。 展开更多
关键词 自然场景图像 文本检测 R2CNN算法
下载PDF
自然场景盲文图像数据集及盲文段检测方法
6
作者 卢利琼 陈长江 +1 位作者 吴东 熊建芳 《计算机工程》 CAS CSCD 北大核心 2023年第10期171-177,共7页
盲文检测是利用人工智能技术自动检测出图像中的盲文位置,是盲文书籍电子化、盲文自动阅卷以及加强正常人与盲人无障碍交流的关键技术。然而现有盲文检测研究领域缺乏自然场景盲文图像数据集和盲文段检测方法。为此,利用手机拍摄、网络... 盲文检测是利用人工智能技术自动检测出图像中的盲文位置,是盲文书籍电子化、盲文自动阅卷以及加强正常人与盲人无障碍交流的关键技术。然而现有盲文检测研究领域缺乏自然场景盲文图像数据集和盲文段检测方法。为此,利用手机拍摄、网络下载等手段构建包含554幅图像的自然场景盲文图像数据集,并对数据集中每一幅图像的盲文段位置进行手动标记。从亮度、对比度和柔和度变化的角度设计图像增强策略来扩充自然场景盲文图像数据集,以辅助卷积神经网络(CNN)训练。在此基础上,分析自然场景盲文段在书写形式和结构上的特点,基于Faster R-CNN算法的思想,提出一种自然场景盲文段检测方法。以ResNet50作为主干网络,通过设计多尺寸CNN特征融合策略挖掘不同尺寸盲文段的特征,设计从32到512的多种锚框参数,以适应自然场景图像中盲文段高度变化小而宽度变化大以及存在较多小尺寸盲文段的特点。实验结果表明,与经典目标检测算法Faster R-CNN和SSD相比,该方法 Hmean值分别从0.793 5和0.800 1提升至0.887 9,检测性能提升明显。 展开更多
关键词 自然场景图像 盲文段检测 卷积神经网络 Faster R-CNN算法 SSD算法
下载PDF
基于深度学习的场景图像自适应文本检测方法
7
作者 杨仁桓 康家杰 +3 位作者 秦传波 麦超云 邱天 喻慧文 《现代电子技术》 2023年第16期143-148,共6页
为了解决自然场景图像中任意形状文本检测的难题,文中提出一种具有自适应文本区域表示的鲁棒场景文本检测方法;同时基于回归和分割方法的两种思想,设计自适应角点检测模块(ACDM)和自适应阈值分割模块(ATSM)。将不同尺度的文本生成不同... 为了解决自然场景图像中任意形状文本检测的难题,文中提出一种具有自适应文本区域表示的鲁棒场景文本检测方法;同时基于回归和分割方法的两种思想,设计自适应角点检测模块(ACDM)和自适应阈值分割模块(ATSM)。将不同尺度的文本生成不同数量的角点进行定位,利用自适应阈值的方法生成文本分割图,结合生成的角点候选框进行联合优化。实验结果表明:所提方法在ICDAR2015数据集上综合指标F为86.5%,相较于PSENet网络提升0.8%;在Total-Text和CTW1500数据集上综合指标F分别为85.3%和84.2%,相较于DBNet网络分别提升0.6%和0.8%。该方法能有效提高任意形状文本检测的鲁棒性。 展开更多
关键词 自适应文本检测 自然场景图像 深度学习 自适应角点检测 自适应阈值分割 ResNet-50网络 特征金字塔网络(FPN)
下载PDF
最大稳定极值区域与笔画宽度变换的自然场景文本提取方法 被引量:18
8
作者 张国和 黄凯 +2 位作者 张斌 符欢欢 赵季中 《西安交通大学学报》 EI CAS CSCD 北大核心 2017年第1期135-140,共6页
针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立... 针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立文本候选区域,利用SWT算法计算文本候选区域笔画宽度得到候选文本区域的笔画宽度;根据笔画宽度图,利用连通域标记建立笔画宽度连通图,然后根据笔画宽度连通图,建立笔画连通图的启发性规则,删除非文本候选区域,并根据文本的几何特征分析及局部自适应窗口最大类间方差(Otsu)分割,有效提取出自然场景图像中的文本,文本提取的准确率、召回率及综合性能分别为0.74、0.64及0.68。仿真实验结果表明,在文本视角多变,字符大小、尺寸、字体各异的复杂条件下,所提方法具有较好的鲁棒性,适用于多语言和多字体混合的场景文本提取。 展开更多
关键词 自然场景图像 文本提取 最大极值稳定区域 笔画宽度变换
下载PDF
基于提升树的自然场景中文文本定位算法研究 被引量:4
9
作者 徐琼 干宗良 +1 位作者 刘峰 陈昌红 《南京邮电大学学报(自然科学版)》 北大核心 2013年第6期76-82,共7页
提出了一种新的基于提升树算法的自然场景中文文本定位技术。首先利用边缘特征进行文本区域的检测,即对下采样后彩色图像首先进行边缘提取、二值化处理,然后通过形态学运算以及连通区域分析去除大量的非字符连通域,获得候选的文本区域,... 提出了一种新的基于提升树算法的自然场景中文文本定位技术。首先利用边缘特征进行文本区域的检测,即对下采样后彩色图像首先进行边缘提取、二值化处理,然后通过形态学运算以及连通区域分析去除大量的非字符连通域,获得候选的文本区域,最后,提取候选文本区域的PHOG-Gabor特征,通过提升树算法进一步确认是否为字符连通域。通过实验验证,该算法具有很高的召回率和准确率,综合性能较高。 展开更多
关键词 文本定位 自然场景图像 提升树算法 PHOG-Gabor特征
下载PDF
基于卷积神经网络的场景图像文本定位研究 被引量:12
10
作者 熊海朋 陈洋洋 陈春玮 《电子科技》 2018年第1期50-53,共4页
针对由于自然场景的复杂性,从自然场景图像中提取出文本信息较困难的问题,文中提出了一种基于深度学习卷积神经网络的文本定位算法。通过对场景图像进行预处理得到候选文本区域,在此基础上结合深度学习中的卷积神经网络来自动提取文本... 针对由于自然场景的复杂性,从自然场景图像中提取出文本信息较困难的问题,文中提出了一种基于深度学习卷积神经网络的文本定位算法。通过对场景图像进行预处理得到候选文本区域,在此基础上结合深度学习中的卷积神经网络来自动提取文本特征进行进一步的定位。通过实验验证,定位的准确率可达86%,综合性能较好。 展开更多
关键词 文本定位 二值化 自然场景图像 卷积神经网络
下载PDF
基于神经网络的自然场景方向文本检测器 被引量:1
11
作者 周铂焱 杨鹏 《计算机与数字工程》 2020年第1期163-166,共4页
场景文本检测是场景文本识别中重要的一步,也是一个具有挑战性的问题。不同于一般的目标检测,场景文本检测的主要挑战在于自然场景图像中的文本具有任意方向,小的尺寸,以及多种宽高比。论文在TextBoxes[8]的基础上进行改进,提出了一个... 场景文本检测是场景文本识别中重要的一步,也是一个具有挑战性的问题。不同于一般的目标检测,场景文本检测的主要挑战在于自然场景图像中的文本具有任意方向,小的尺寸,以及多种宽高比。论文在TextBoxes[8]的基础上进行改进,提出了一个适用于任意方向文本的检测器,命名为OSTD(Oriented Scene Text Detector),可以有效且准确地检测自然场景中任意方向的文本。论文在公共数据集上对提出OSTD的进行评估。所有实验结果都表明,无论在准确性,还是实时性方面OSTD都是极具竞争力的方法。在1024×1024的ICDAR2015 Incidental Text数据集[16]上,OSTD的F-Measure=0.794,FPS=10.7。 展开更多
关键词 自然场景图像 文本检测 神经网络
下载PDF
挖掘文本框位置特性的anchor-free自然场景文本检测 被引量:2
12
作者 卢利琼 吴东 +1 位作者 吴涛 刘瑶 《计算机应用研究》 CSCD 北大核心 2021年第8期2556-2560,共5页
针对现有优秀的anchor-free文本检测方法只挖掘了文本框几何特性而没有考虑文本框位置特性且缺乏有效的过滤机制,提出了挖掘文本框位置特性的anchor-free自然场景文本检测方法。该方法以ResNet50作为卷积神经网络的主干网络,将多个不同... 针对现有优秀的anchor-free文本检测方法只挖掘了文本框几何特性而没有考虑文本框位置特性且缺乏有效的过滤机制,提出了挖掘文本框位置特性的anchor-free自然场景文本检测方法。该方法以ResNet50作为卷积神经网络的主干网络,将多个不同尺寸的特征层融合后预测文本框的几何特性和位置特性,最后辅之以二层过滤机制得到最终的检测文本框。在公开的数据集ICDAR2013和ICDAR2011上F值分别达到了0.870和0.861,证明了该方法的有效性。 展开更多
关键词 自然场景图像 文本检测 位置特性 anchor-free 卷积神经网络
下载PDF
一种改进卷积循环神经网络的复杂场景下的车牌识别模型
13
作者 洪顺贺 胡宸滔 +1 位作者 铁治欣 丁成富 《建模与仿真》 2023年第3期2498-2504,共7页
识别自然场景图像中的汽车牌照是一项重要而又具有挑战性的任务。许多现有方法对于在固定场景下收集的牌照表现良好,但它们的性能在诸如车牌角度倾斜、光照强度过亮或过暗、图片模糊等复杂的环境中显著下降。本文提出了一种改进的卷积... 识别自然场景图像中的汽车牌照是一项重要而又具有挑战性的任务。许多现有方法对于在固定场景下收集的牌照表现良好,但它们的性能在诸如车牌角度倾斜、光照强度过亮或过暗、图片模糊等复杂的环境中显著下降。本文提出了一种改进的卷积循环神经网络车牌识别模型,在网络中加入幻影模块(Ghost Block)和卷积块注意模块(Convolutional Block Attention Module, CBAM),能够提高车牌字符特征提取的丰富程度的同时在通道和空间方向上对车牌字符特征进行加权,提高模型对车牌字符识别的准确率。最后通过实验验证了本文提出的模型的有效性。 展开更多
关键词 循环神经网络 车牌识别 车牌字符识别 自然场景图像 汽车牌照 复杂场景 空间方向 卷积
下载PDF
支持向量机的多目标图像分割算法仿真研究 被引量:1
14
作者 杨怀义 《计算机仿真》 CSCD 北大核心 2011年第12期223-226,共4页
研究图像的目标分割和识别优化问题,针对大量自然场景图像中分割出的各种不同目标,从各种背景分割出有意义的目标有困难。为了从图像中准确分割目标,提出了一种支持向量机(SVM)的多目标分割技术。首先将图像分割为较小的区域,并利用区... 研究图像的目标分割和识别优化问题,针对大量自然场景图像中分割出的各种不同目标,从各种背景分割出有意义的目标有困难。为了从图像中准确分割目标,提出了一种支持向量机(SVM)的多目标分割技术。首先将图像分割为较小的区域,并利用区域融合算法将其合并为语义目标。然后通过用户的交互,指定部分关键点和关键区域,并使用支持向量机算法,将图像中的各区域分类为关键区域,融合为最终的目标区域。试验结果显示方法能分割出图像中不同的目标,能够更好地保留图像分割细节信息,使分割结果与人眼视觉的判断标准相近,证明改进的方法能广泛适用于多目标自动识别。 展开更多
关键词 自然场景图像 目标分割 支持向量机
下载PDF
融合边缘测度的自然场景彩色图像区域分割 被引量:6
15
作者 代沁伶 王雷光 洪亮 《中国图象图形学报》 CSCD 北大核心 2013年第5期523-528,共6页
针对传统分割方法基于单个视觉线索的不足,提出一种结合两种局部边缘测度的自然场景彩色图像区域分割方法。首先,采用logistic回归模型对200幅彩色图像进行训练,建立边缘测度与对象边界的回归模型;然后,采用该模型预测图像中每个像素的... 针对传统分割方法基于单个视觉线索的不足,提出一种结合两种局部边缘测度的自然场景彩色图像区域分割方法。首先,采用logistic回归模型对200幅彩色图像进行训练,建立边缘测度与对象边界的回归模型;然后,采用该模型预测图像中每个像素的边界置信度;最后,将置信度的函数以自适应权重的形式整合到均值漂移分割算法中,实现图像区域分割。近20幅图像的定量和目视对比实验结果表明,本文方法能有效地控制过分割和欠分割的产生,且具有更好的区域边界定位效果。 展开更多
关键词 区域分割 自然场景图像 边缘检测 均值漂移
原文传递
一种采用LLE降维和贝叶斯分类的多类标学习算法 被引量:4
16
作者 李宏 谢政 +1 位作者 向遥 吴敏 《系统工程与电子技术》 EI CSCD 北大核心 2009年第6期1467-1472,共6页
多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低... 多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低维特征属性集;然后将多类标样本集按所属的类标进行划分,并采用贝叶斯分类模型来学习各组样本集的分类特性;根据各个分类模型的判定类标,综合得到多类标样本的最终类标集。将该算法分别应用到自然场景图像和基因数据的多类标分类学习中,实验结果表明,该算法针对不同的多类标数据集均能取得很好的分类效果,且相比于其他多类标算法有更高的性能。 展开更多
关键词 多类标学习 朴素贝叶斯分类 自然场景图像分类 基因数据集分类
下载PDF
基于边缘的标志牌文本提取方法 被引量:6
17
作者 崔莹莹 杨杰 梁栋 《影像技术》 CAS 2006年第1期28-30,共3页
标志牌上包含了许多重要的信息,提取自然场景图像中标志牌上的文本具有很高的实用价值。本文提出了一种有效的基于边缘的文本提取方法。该方法对背景的复杂度、文字的颜色、大小以及排列方向具有很强的鲁棒性。首先,算法有效地去除大量... 标志牌上包含了许多重要的信息,提取自然场景图像中标志牌上的文本具有很高的实用价值。本文提出了一种有效的基于边缘的文本提取方法。该方法对背景的复杂度、文字的颜色、大小以及排列方向具有很强的鲁棒性。首先,算法有效地去除大量不规则的非文本长边缘;然后,针对不同的字符大小范围进行分级提取,根据文本区域中边缘之间的关系,用窗口法扫描边缘图像,进一步去除非文本边缘;然后,将提取的结果合并。在验证阶段,本文应用了字符边缘的特点,提高验证的准确率。最后,详细介绍了实验结果。 展开更多
关键词 自然场景图像 标识牌文本提取 边缘检测
下载PDF
融合语义—表观特征的无监督前景分割 被引量:1
18
作者 李熹 马惠敏 +1 位作者 马洪兵 王弈冬 《中国图象图形学报》 CSCD 北大核心 2021年第10期2503-2513,共11页
目的前景分割是图像理解领域中的重要任务,在无监督条件下,由于不同图像、不同实例往往具有多变的表达形式,这使得基于固定规则、单一类型特征的方法很难保证稳定的分割性能。针对这一问题,本文提出了一种基于语义—表观特征融合的无监... 目的前景分割是图像理解领域中的重要任务,在无监督条件下,由于不同图像、不同实例往往具有多变的表达形式,这使得基于固定规则、单一类型特征的方法很难保证稳定的分割性能。针对这一问题,本文提出了一种基于语义—表观特征融合的无监督前景分割方法(semantic apparent feature fusion,SAFF)。方法基于语义特征能够对前景物体关键区域产生精准的响应,但往往产生的前景分割结果只关注于关键区域,缺乏物体的完整表达;而以显著性、边缘为代表的表观特征则提供了更丰富的细节表达信息,但基于表观规则无法应对不同的实例和图像成像模式。为了融合表观特征和语义特征优势,研究建立了融合语义、表观信息的一元区域特征和二元上下文特征编码的方法,实现了对两种特征表达的全面描述。接着,设计了一种图内自适应参数学习的方法,用于计算最适合的特征权重,并生成前景置信分数图。进一步地,使用分割网络来学习不同实例间前景的共性特征。结果通过融合语义和表观特征并采用图像间共性语义学习的方法,本文方法在PASCAL VOC(pattern analysis,statistical modelling and computational learning visual object classes)2012训练集和验证集上取得了显著超过类别激活映射(class activation mapping,CAM)和判别性区域特征融合方法(discriminative regional feature integration,DRFI)的前景分割性能,在F测度指标上分别提升了3.5%和3.4%。结论本文方法可以将任意一种语义特征和表观特征前景计算模块作为基础单元,实现对两种策略的融合优化,取得了更优的前景分割性能。 展开更多
关键词 计算机视觉 前景分割 无监督学习 语义—表观特征融合 自然场景图像 PASCAL VOC数据集 自适应加权
原文传递
A multiphase texture segmentation method based on local intensity distribution and Potts model
19
作者 王靖 郑永果 +2 位作者 潘振宽 张维忠 王国栋 《Optoelectronics Letters》 EI 2015年第4期307-312,共6页
Because texture images cannot be directly processed by the gray level information of individual pixel,we propose a new texture descriptor which reflects the intensity distribution of the patch centered at each pixel.T... Because texture images cannot be directly processed by the gray level information of individual pixel,we propose a new texture descriptor which reflects the intensity distribution of the patch centered at each pixel.Then the general multiphase image segmentation model of Potts model is extended for texture segmentation by adding the region information of the texture descriptor.A fast numerical scheme based on the split Bregman method is designed to speed up the computational process.The algorithm is efficient,and both the texture descriptor and the characteristic functions can be implemented easily.Experiments using synthetic texture images,real natural scene images and synthetic aperture radar images are presented to give qualitative comparisons between our method and other state-of-the-art techniques.The results show that our method can accurately segment object regions and is competitive compared with other methods especially in segmenting natural images. 展开更多
关键词 texture segmentation multiphase descriptor pixel patch processed scene neighborhood minimization
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部