摘要
计算机图像光学字符识别技术(OpticalCharacter Recognition,简称OCR),是指对文本资料的图像文件进行分析识别处理,获取文件及版面信息的过程,其中主要包括图像输入、图像前期处理(二值化、图像降噪、倾斜校正)、中期处理(版面分析、字符切割、字符识别、版面还原)、后期处理(识别校正),最终将图像中的文字转换输出为可编辑的文本格式。本文主要利用Python语言及Paddle OCR图像识别框架。
出处
《数字技术与应用》
2022年第12期117-119,共3页
Digital Technology & Application