针对复杂场景中纹理丰富的非文字区对文字定位算法的干扰,提出了基于光度不变量的角点类别特征和边缘幅值方向梯度直方图(Histogram of oriented gradients of edge magnitude,HOG-EM)统计特征两种新特征,并据此设计了一种两级多层复杂...针对复杂场景中纹理丰富的非文字区对文字定位算法的干扰,提出了基于光度不变量的角点类别特征和边缘幅值方向梯度直方图(Histogram of oriented gradients of edge magnitude,HOG-EM)统计特征两种新特征,并据此设计了一种两级多层复杂场景文字定位算法。首先获取边缘图像并提取根据HSL颜色空间特性划分的8层二值化图像,将其组成9层子图并做连通域分析提取文字候选区。然后提取文字候选区的角点类别特征和HOG-EM统计特征,将二者分别用于剔除非文字候选区和获取文字。实验表明:本文算法可以较为准确地剔除纹理丰富的非文字区,有效地降低复杂场景文字定位算法的虚警率,取得比较理想的准确率和召回率。展开更多
非约束环境下采集的人脸图像复杂多变,将其直接作为字典原子用于稀疏表示分类(sparserepresentation based classification, SRC),识别效果不理想.针对该问题,本文提出一种基于旋转主方向梯度直方图特征的判别稀疏图映射(discriminative...非约束环境下采集的人脸图像复杂多变,将其直接作为字典原子用于稀疏表示分类(sparserepresentation based classification, SRC),识别效果不理想.针对该问题,本文提出一种基于旋转主方向梯度直方图特征的判别稀疏图映射(discriminative sparse graph embedding based on histogram of rotated principalorientation gradients, DSGE-HRPOG)算法,用于构建类内紧凑、类间分离的低维判别特征字典,提高稀疏表示分类准确性.首先,采用旋转主方向梯度直方图(histogram of rotated principal orientation gradients,HRPOG)特征算子提取非约束人脸图像的多尺度多方向梯度特征,有效去除外界干扰和像素间冗余信息,构建稳定、鉴别的HRPOG 特征字典;其次,引入判别稀疏图映射(discriminative sparse graph embedding,DSGE)算法,以类内重构散度最小、类间重构散度最大为目标计算特征字典的最佳低维投影矩阵,进一步增强低维特征字典的判别性、紧致性;最后,提出投影矩阵和稀疏重构关系交替迭代优化算法,将维数约简过程伴随在稀疏图构建过程中,使分类效果更理想.在AR, Extended Yale B, LFW 和PubFig 这4 个数据库上进行大量实验,验证了本文算法在实验环境数据库和真实环境数据库上的有效性.展开更多
文摘针对复杂场景中纹理丰富的非文字区对文字定位算法的干扰,提出了基于光度不变量的角点类别特征和边缘幅值方向梯度直方图(Histogram of oriented gradients of edge magnitude,HOG-EM)统计特征两种新特征,并据此设计了一种两级多层复杂场景文字定位算法。首先获取边缘图像并提取根据HSL颜色空间特性划分的8层二值化图像,将其组成9层子图并做连通域分析提取文字候选区。然后提取文字候选区的角点类别特征和HOG-EM统计特征,将二者分别用于剔除非文字候选区和获取文字。实验表明:本文算法可以较为准确地剔除纹理丰富的非文字区,有效地降低复杂场景文字定位算法的虚警率,取得比较理想的准确率和召回率。
基金Supported by the National Natural Science Foundation of China(61701069)the Fundamental Research Funds for the Central Univer⁃sities of China(3132019340,3132019200).