拍摄或扫描图书文档时,所获得的页面图像会有不同程度的扭曲形变,这不仅影响美观或视觉效果,而且影响其深层处理,如OCR(Optical Character Recognition)字符识别。为解决上述问题,提出一种改进的基于模型的扭曲页面校正算法。首先对输...拍摄或扫描图书文档时,所获得的页面图像会有不同程度的扭曲形变,这不仅影响美观或视觉效果,而且影响其深层处理,如OCR(Optical Character Recognition)字符识别。为解决上述问题,提出一种改进的基于模型的扭曲页面校正算法。首先对输入图像进行转正预处理,并通过以图像梯度信息确定阈值的二值化方法去除页面的灰色背景,然后利用简易的直线结构光提取页面文字行点集,由点集中心点曲线构建柱面模型进行页面校正。实验表明该方法能适应更多不同的页面扭曲类型,校正和去背景处理效果好、效率高,可显著提高OCR识别率,而且系统结构简便,容易实现。展开更多
文摘拍摄或扫描图书文档时,所获得的页面图像会有不同程度的扭曲形变,这不仅影响美观或视觉效果,而且影响其深层处理,如OCR(Optical Character Recognition)字符识别。为解决上述问题,提出一种改进的基于模型的扭曲页面校正算法。首先对输入图像进行转正预处理,并通过以图像梯度信息确定阈值的二值化方法去除页面的灰色背景,然后利用简易的直线结构光提取页面文字行点集,由点集中心点曲线构建柱面模型进行页面校正。实验表明该方法能适应更多不同的页面扭曲类型,校正和去背景处理效果好、效率高,可显著提高OCR识别率,而且系统结构简便,容易实现。