为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(F...为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(FuzzyC-Means)聚类方法产生局部阈值。这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影。实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高。展开更多
针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,...针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,即U-Net对背景减除图像进行前景背景分割,最后采用全局最优阈值处理方法获得最终二值图像。实验结果表明,在2016和2017年国际文档图像二值化竞赛(DIBCO)中该算法的F值(F-measure,FM)、伪F值(pseudo F-measure,p-FM)、峰值信噪比(peak signal to noise ratio,PSNR)、距离倒数失真度量(distance reciprocal distortion,DRD)比性能次优的经典算法最高有5.58%、2.47%、0.86 dB、1.19%的性能提升。展开更多
文本图像二值化算法的优劣直接影响图像文本字符识别的准确率。秦简文字图像受制于背景光照欠均衡和噪声复杂等因素影响,传统文本图像二值化算法无法准确分割其前景和背景,秦简文字轮廓等特征无法准确提取,二值化效果达不到文本高准确...文本图像二值化算法的优劣直接影响图像文本字符识别的准确率。秦简文字图像受制于背景光照欠均衡和噪声复杂等因素影响,传统文本图像二值化算法无法准确分割其前景和背景,秦简文字轮廓等特征无法准确提取,二值化效果达不到文本高准确识别要求。针对图像质量不平衡的秦简文字图像提出了一种基于图像信噪比自适应阈值模型的二值化算法。首先,将图像进行灰度转换、调整亮度和降噪等一系列二值化前的预先处理;其次,根据图像信噪比(SNR)大小自适应设置阈值,分别采用OTSU算法和Bernsen算法进行二值化处理;最后,由峰值信噪比(PSNR)与结构相似性(SSIM)评价指标择优选取二值化图像,从而准确地提取秦简图像二值化后的文字轮廓。在自建的秦简文字数据集QBS text dataset上的测试结果表明,该算法的二值化结果保留了更多的秦简文字细节特征和文字轮廓,其峰值信噪比和精确率也分别达到25.61 dB和76.67%,相较其他经典文本图像二值化算法,其性能指标均有较大提升。展开更多
文摘为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(FuzzyC-Means)聚类方法产生局部阈值。这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影。实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高。
文摘针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,即U-Net对背景减除图像进行前景背景分割,最后采用全局最优阈值处理方法获得最终二值图像。实验结果表明,在2016和2017年国际文档图像二值化竞赛(DIBCO)中该算法的F值(F-measure,FM)、伪F值(pseudo F-measure,p-FM)、峰值信噪比(peak signal to noise ratio,PSNR)、距离倒数失真度量(distance reciprocal distortion,DRD)比性能次优的经典算法最高有5.58%、2.47%、0.86 dB、1.19%的性能提升。
文摘文本图像二值化算法的优劣直接影响图像文本字符识别的准确率。秦简文字图像受制于背景光照欠均衡和噪声复杂等因素影响,传统文本图像二值化算法无法准确分割其前景和背景,秦简文字轮廓等特征无法准确提取,二值化效果达不到文本高准确识别要求。针对图像质量不平衡的秦简文字图像提出了一种基于图像信噪比自适应阈值模型的二值化算法。首先,将图像进行灰度转换、调整亮度和降噪等一系列二值化前的预先处理;其次,根据图像信噪比(SNR)大小自适应设置阈值,分别采用OTSU算法和Bernsen算法进行二值化处理;最后,由峰值信噪比(PSNR)与结构相似性(SSIM)评价指标择优选取二值化图像,从而准确地提取秦简图像二值化后的文字轮廓。在自建的秦简文字数据集QBS text dataset上的测试结果表明,该算法的二值化结果保留了更多的秦简文字细节特征和文字轮廓,其峰值信噪比和精确率也分别达到25.61 dB和76.67%,相较其他经典文本图像二值化算法,其性能指标均有较大提升。