期刊文献+

灰度图像中字符切分方法的研究 被引量:11

A Study on Segmentation Method for Gray Document Image
下载PDF
导出
摘要 字符切分目前已经成为限制OCR技术发展的瓶颈 ,对于图像质量较差、中英文混排和背景色变化的文本图像 ,传统切分方法造成的切分错误使得文字识别率大大降低。针对这些问题 ,本文提出了新型文字切分方法。该方法先将灰度图像的灰度值进行分级处理 ,再根据分级连通域的概念把整个图像构造成树状结构 ,然后确定主层次级别 ,根据一定的规则在部分节点上进行合并、分割等进一步处理 ,最后得到最优的切分结果。实验结果表明 。 In order to overcome the weakness of conventional segmentation algorithm in OCR, this paper presents a new segmentation method for gray document image. Important features of the new method include grading of the grayscale of pixels in image and construction of a tree structures for the whole document image. By dividing this trees branches and leaves, characters, pictures and forms can be correctly segmented. The experiment results showed that this method is very effective for document with both Chinese and English characters or document with different backgrounds.
出处 《中文信息学报》 CSCD 北大核心 2004年第4期44-49,共6页 Journal of Chinese Information Processing
基金 8 6 3计划资助项目 (2 0 0 3AA1Z2 2 30 ) 科技部中小企业创新基金资助项目 (0 1C2 6 2 1 4 4 2 0 2 0 7) 计算所领域前沿青年基金资助项目 (2 0 0 2 6 1 80 - 1 9)
关键词 人工智能 模式识别 字符切分 灰度图像 OCR artificial intelligence pattern recognition character segmentation gray image OCR
  • 相关文献

参考文献6

  • 1Sankur B, Sezgin M. Image Thresholding Techniques: A Survey over Categories[R]. a technique report of 2001.
  • 2Casey R G, Lecolinet E. A Survey of Methods and Strategies in Character Segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(7):690-706.
  • 3吕凤军.数字图像处理编程入门[M].北京:清华大学出版社,1999..
  • 4张炘中.汉字识别技术[M].北京:清华大学出版社,1992..
  • 5朱军明 黄磊 刘昌平.图像二值化方法的比较[A]..第八届全国汉字识别学术会议论文集[C].,.110-116.
  • 6徐蔚然 于武贵 郭军.基于统计方法的混排文字切分与分类[A]..第八届全国汉字识别学术会议论文集[C].,.123-129.

共引文献35

同被引文献92

引证文献11

二级引证文献50

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部