摘要
为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(FuzzyC-Means)聚类方法产生局部阈值。这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影。实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高。
To improve the binarization effects of camera-based document images, and reduce error rate of the optical character recognition (OCR) system, a binarization algorithm VFCM is proposed based on the combination of the global threshold and the local threshold. The global threshold is computed by maximal variance ratio algorithm and the local threshold is computed by Fuzzy C-Means (FCM) algorithm. The VFCM algorithm can well reserve character strokes.and eliminate ghost artifacts. Experiments show that the proposed algorithm could yield better visual quality and OCR performance.
出处
《计算机工程与设计》
CSCD
北大核心
2009年第13期3216-3218,3243,共4页
Computer Engineering and Design
基金
北京市教委科技发展面上基金项目(KM200710009005)
北方工业大学重点研究基金项目(NCUT20090106)
北方工业大学科研基金项目
北方工业大学科研平台及团队建设基金项目