期刊文献+

几种文本图像二值化方法的对比分析 被引量:41

Comparison and Analysis of Several Document Image Binarization Algorithms
下载PDF
导出
摘要 文档图像二值化是光学字符识别(OCR)预处理阶段的关键技术,其处理效果的好坏直接影响光学字符识别的识别率的高低.本文对几种全局阈值算法与自适应局部阈值算法进行了研究分析,从理论模型和实例文档图像两个方面综合分析了OTSU法、迭代法、简单统计法、Bersen、Niblack、VFCM、NFCM等二值化算法.通过实验、对比分析表明,几种算法各自具有其优缺点,对一些复杂文档图像情况的适应性也各不相同.在实际应用中,应根据具体的文档图像质量、周围环境的光照,以及对图像处理时间的要求等情况选择合适的文档图像二值化算法. Document image binarization is the key technology of Optical Character Recognition(OCR)'s preprocessing.The result of the process directly influences OCR system's recognition rate.In this paper,several global threshold algorithms and adaptive local threshold algorithms are researched and analyzed.The methods of OTSU,iteration,simple statistics,Bersen,Niblack,VFCM and NFCM are compared from the aspects of theoretical models and case studies.Experimental results show that each algorithm has its own advantages and disadvantages.Under different document image situations,these algorithms also have different adaptabilities.In practical application,the appropriate algorithm for the document image binarization should be selected according to different document image quality,surrounding light environment,and the time demanded of image processing.
出处 《北方工业大学学报》 2011年第1期25-33,共9页 Journal of North China University of Technology
基金 "十一五"国家科技支撑计划重点项目(2009BAI71B02) 北京市属高等学校人才强教计划资助项目(PHR20110865) 北京市大学生科学研究与创业行动计划
关键词 文本图像 二值化 识别率 document image binarization recognition rate
  • 相关文献

参考文献9

二级参考文献40

共引文献116

同被引文献318

引证文献41

二级引证文献188

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部