灰度图像中字符切分方法的研究被引量：11

A Study on Segmentation Method for Gray Document Image

下载PDF

导出

摘要字符切分目前已经成为限制OCR技术发展的瓶颈 ,对于图像质量较差、中英文混排和背景色变化的文本图像 ,传统切分方法造成的切分错误使得文字识别率大大降低。针对这些问题 ,本文提出了新型文字切分方法。该方法先将灰度图像的灰度值进行分级处理 ,再根据分级连通域的概念把整个图像构造成树状结构 ,然后确定主层次级别 ,根据一定的规则在部分节点上进行合并、分割等进一步处理 ,最后得到最优的切分结果。实验结果表明。 In order to overcome the weakness of conventional segmentation algorithm in OCR, this paper presents a new segmentation method for gray document image. Important features of the new method include grading of the grayscale of pixels in image and construction of a tree structures for the whole document image. By dividing this trees branches and leaves, characters, pictures and forms can be correctly segmented. The experiment results showed that this method is very effective for document with both Chinese and English characters or document with different backgrounds.

作者陈艳孙羽菲张玉志

机构地区中国科学院计算技术研究所中国科学院研究生院

出处《中文信息学报》 CSCD 北大核心 2004年第4期44-49,共6页 Journal of Chinese Information Processing

基金 8 6 3计划资助项目 (2 0 0 3AA1Z2 2 30 ) 科技部中小企业创新基金资助项目 (0 1C2 6 2 1 4 4 2 0 2 0 7) 计算所领域前沿青年基金资助项目 (2 0 0 2 6 1 80 - 1 9)

关键词人工智能模式识别字符切分灰度图像 OCR artificial intelligence pattern recognition character segmentation gray image OCR

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1Sankur B, Sezgin M. Image Thresholding Techniques: A Survey over Categories[R]. a technique report of 2001.
2Casey R G, Lecolinet E. A Survey of Methods and Strategies in Character Segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(7):690-706.
3吕凤军.数字图像处理编程入门[M].北京：清华大学出版社,1999..
4张炘中.汉字识别技术[M].北京：清华大学出版社,1992..
5朱军明黄磊刘昌平.图像二值化方法的比较[A]..第八届全国汉字识别学术会议论文集[C].,.110-116.
6徐蔚然于武贵郭军.基于统计方法的混排文字切分与分类[A]..第八届全国汉字识别学术会议论文集[C].,.123-129.

共引文献35

1王晓兰,香兴民,杨新华,朱黎,黄建龙,安宗文.航天器材料光学性能原位测量系统控制软件的开发[J].测控技术,2004,23(8):50-52. 被引量：1
2付宇光,唐焕文,计明军,钟明军,唐一源.模拟退火算法在图像配准中的应用[J].中国生物医学工程学报,2004,23(5):405-409. 被引量：5
3陈小红,李晓蕾,朱秀昌.一种基于小波的数字水印技术研究[J].南京邮电学院学报（自然科学版）,2004,24(4):6-10. 被引量：2
4薛雪,刘泽平,丁艳.基于区域增长的图像跟踪算法的研究[J].光学技术,2005,31(1):152-154. 被引量：6
5常红,刘利亭.云纹干涉图像的数字采集及处理方法的研究[J].太原重型机械学院学报,2005,26(1):66-69. 被引量：1
6吴建国,俞庆英,吴海辉.汉字笔画若干数据的统计方法研究与应用[J].安徽大学学报（自然科学版）,2005,29(3):14-20. 被引量：14
7周祥,李正明,孙俊.轮胎胎号字符识别系统[J].计测技术,2005,25(4):21-22.
8程红梅,颜钢锋.纹织CAD中多层显示组件的设计[J].丝绸,2005,42(9):34-36.
9李平,李伟光.医学图像视觉无损压缩的研究[J].长春理工大学学报（自然科学版）,2005,28(3):33-35.
10秦姣华,向旭宇.汉字复杂指数特征提取技术的实现及其改进[J].计算机工程与设计,2006,27(2):265-267. 被引量：3

同被引文献92

1刘赛,李益东.彝文文字识别中的文字切分算法设计与实现[J].中南民族大学学报（自然科学版）,2007,26(3):70-72. 被引量：14
2苑玮琦,穆长江,李德胜.一种基于汉字结构特征的车牌照字符分割方法[J].仪器仪表学报,2003,24(z2):472-474. 被引量：11
3杨道普,马秋禾,石磊.边缘检测Prewitt算子的改进算法[J].测绘科学,2008,33(S1):100-101. 被引量：12
4陈昌槐.水族文字与《水书》[J].中央民族大学学报（哲学社会科学版）,1991,18(3):64-69. 被引量：11
5陈默,何小海,吴炜,杨晓敏,付光荣.结合独立与连续字符识别的集装箱号识别技术[J].四川大学学报（工程科学版）,2011,43(S1):139-145. 被引量：5
6岳振军,邱望成,刘春林.一种自适应的多目标图像分割方法[J].中国图象图形学报（A辑）,2004,9(6):674-678. 被引量：27
7凌彤辉,黄山,王新增,王鉴.车牌字符分割算法的研究[J].中国测试技术,2005,31(1):41-43. 被引量：11
8林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图象图形学报（A辑）,2005,10(1):1-10. 被引量：322
9丁明跃,彭嘉雄.基于内点保留的二值图像细化算法[J].华中理工大学学报,1994,22(1):79-83. 被引量：9
10吕俊哲.图像二值化算法研究及其实现[J].科技情报开发与经济,2004,14(12):266-267. 被引量：27

引证文献11

1钟辉,刘辉,姜小帅.一种基于数据分析的字符切分方法[J].沈阳建筑大学学报（自然科学版）,2006,22(1):158-162.
2钟辉,高晓石,牛志成.灰度文档图像字符切分方法[J].沈阳建筑大学学报（自然科学版）,2006,22(3):483-486. 被引量：3
3黄祥林,高芸,杨丽芳,王鹏鹏.一种基于关键词的中文文档图像检索方法[J].中文信息学报,2007,21(4):61-64. 被引量：5
4马瑞,杨静宇.一种利用灰度信息和二值信息的手写字符分割[J].计算机工程,2007,33(15):175-177. 被引量：2
5杨晓娟,宋凯.基于投影法的文档图像分割算法[J].成都大学学报（自然科学版）,2009,28(2):139-141. 被引量：9
6左敏,曾广平,涂序彦,古世东.基于等价对的图像连通域标记算法[J].计算机仿真,2011,28(1):14-16. 被引量：14
7吴晓林,冯炜,张红瑞.基于自适应阈值的网格图像行分割算法[J].计算机与网络,2012,38(23):50-52.
8李博,李仕奇,谭振豪.基于机器视觉的封印产品字符编码检测系统[J].现代制造工程,2013(6):88-91. 被引量：7
9孔斌,喻民,刘超,李续.保密检查中图像文件内容识别技术研究[J].保密科学技术,2014,0(7):42-45. 被引量：1
10张国锋.水书古籍的字切分方法[J].黔南民族师范学院学报,2016,36(2):40-44. 被引量：6

二级引证文献50

1韩清涛,张丽娟.晶振字符自动检测系统的设计与实现[J].东莞理工学院学报,2009,16(1):60-63.
2刘劼.文档图像检索系统中的版面提取及内容分析方法[J].科技创新导报,2009,6(8):86-86.
3刘劼.一种文档页面的样式分类方法[J].科技创新导报,2009,6(15):238-238.
4马瑞,顾韵华,严云洋.一种基于识别后处理的手写英文字符串分割[J].武汉理工大学学报,2010,32(16):34-38.
5邓胜江,王海峰,姜利.铁路客票自动核对票号的研究[J].铁路计算机应用,2011,20(1):30-32. 被引量：2
6栾一秀,郭帅,袁洪波,张旭,曹雅坤.油管接箍运动图像的检测与识别[J].电子测量技术,2011,34(8):41-44. 被引量：5
7熊邦书,张超,柳青,陈乐平.基于图像的点读坐标提取方法[J].半导体光电,2011,32(6):886-889. 被引量：3
8宋南,赵晶.基于改进型像素标记算法的目标定位[J].现代电子技术,2012,35(5):52-54. 被引量：14
9谢祥徐.基于链表的图像连通区域提取算法[J].数字通信,2012,39(3):34-38. 被引量：1
10洪雅敏.面向二代身份证的图文识别[J].兰州工业学院学报,2013,20(6):18-22.

1唐琳.多传感器信息融合的层级关系研究[J].赤峰学院学报（自然科学版）,2014,30(19):21-23. 被引量：4
2钱国栋.扫描与质量控制[J].张家口师专学报,2003,19(6):33-34.
3帅仕麟.谈谈家用扫描仪[J].网络与信息,2002,16(11):28-28.
4楚杰.如何提高扫描仪的文字识别率[J].计算机与农业,2003(3):21-21.
5李良旭,孙高祥,张哲.一种光照不均文本图像的校正算法[J].电脑与信息技术,2014,22(1):14-16.
6易博.服务外包业中OCR前期对图片的处理[J].电子测试,2009,20(7):83-86. 被引量：1
7刘梅.方正U430扫描仪超大透扫准确识别[J].中国计算机用户,2004(35):42-42.
8资料输入不再烦恼——TG超级扫描笔[J].中国传媒科技,2003(8):55-55.
9资料输入不再烦恼——TG超级扫描笔[J].中国传媒科技,2003(9):58-58.
10徐静波,周美华.分形模糊控制[J].上海工程技术大学学报,2001,15(4):243-248.

中文信息学报

2004年第4期

浏览历史

内容加载中请稍等...

灰度图像中字符切分方法的研究被引量：11

参考文献6

共引文献35

同被引文献92

引证文献11

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

灰度图像中字符切分方法的研究 被引量：11

参考文献6

共引文献35

同被引文献92

引证文献11

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

灰度图像中字符切分方法的研究被引量：11