基于边缘和颜色的视频文本图像分割方法被引量：5

Video Text Image Segmentation Method Based on Edge and Color Features

下载PDF

导出

摘要视频中的文本如果直接送入OCR软件,识别率较低,因为文本往往叠加在复杂背景中,所以需要先将文本从背景中分割出来。背景像素可能具有和文本像素相似的颜色,并且由于解压缩的影响,文本像素颜色分布可能具有渐变性,给分割带来一定的困难。针对这些问题,提出一种基于文本边缘和颜色特征的文本分割方法,该方法首先利用文本边缘的高频特性沿文本轮廓对图像的颜色分布进行采样;其次使用K-均值空间聚类方法从采样点集合得到图像分割的种子点和分割半径,从而分割文本图像得到不同的分割结果;最后,利用文本笔画的连通域特征挑选出正确的分割结果。实验表明,该方法较好的解决了视频文本和背景的分离问题,分割结果具有较高的OCR识别率。 Before video text images are input to OCR software, text should be separated from background, because video texts often are embedded in complex background. There are two problems： one is that the color of background pixels may be similar with the color of text pixels, the other one is that the color of text pixels has variance caused by video compression and decompression. To solve the two problems, a new text image segmentation algorithm was introduced based on text edge and color features. First, the sample pixels set was got according to high frequency edge information of text. Second, K-means clustering method was applied to get segmentation seed pixels and radius, then segment text image into several text candidate images. Last, false text candidate images were excluded according to connected component property of text strokes Experimental result shows that this method can separate text from background easily, and gets good OCR result.

作者朱成军欧阳元新盛浩熊璋

机构地区北京航空航天大学计算机学院

出处《系统仿真学报》 EI CAS CSCD 北大核心 2008年第23期6498-6501,共4页 Journal of System Simulation

基金航空支撑科技基金(05E551010)

关键词视频检索文本检测文本分割 K-均值聚类 video indexing video text detection text segmentation K-means clustering

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1蔡波,周洞汝,胡宏斌.数字视频中字幕检测及提取的研究和实现[J].计算机辅助设计与图形学学报,2003,15(7):898-903. 被引量：16
2X L Chen, J Yang, J. Zhang, A Waibel. Automatically text detection and recognition in natural scene images [C]// IEEE Trans. Image Processing, 2004. USA: IEEE, 2004, V13:87-99.
3Li Hui-ping, Doermann D. Text enhancement in digital video using multiple frame integration [C]// Proceedings of ACM Multimedia 1999, Orlando FL, USA. USA: ACM, 1999: 19-22.
4V Wu, R Manmatha, E M Riseman. Textfinder: an automatic system to detect and recognize text in images [C]//IEEE Trans. PAMI, 1999. USA: IEEE, 1999, V20: 1224-1229.
5C M Tsai, H J Lee. Binarization of color document images via luminance and saturation color features [C]//IEEE Trans. on Image Processing, 2002, 11(4): 434-451.
6R Lienhart, A Wernicke. Localizing and segmenting text in images and videos [C]// IEEE Trans. Circuits and Systems for Video Technology, 2002, 12: 256-268.
7叶齐祥.图像和视频检测技术研究[D].北京:中国科学院研究生院,2005.
8章毓晋.图像工程-图像处理[M].北京:清华大学出版社,2006.
9张炘中.汉字识别技术[M].北京：清华大学出版社,1992..

二级参考文献5

1Ohya J, Shio A, Akamatsu S. Recognizing characters in scene images [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1994, 16(7): 214～224
2Lopresti D, Zhou J. Document analysis and the world wide web[A]. In: Proceedings of International Workshop on Document Analysis Systems, Malvern, PA, 1996. 651～669
3Yeo B L, Liu B. Visual content highlighting via automatic extraction of embedded captions on MPEG compressed video [A]. In: Proceedings of SPIE Digital Video Compression: Algorithms and Technology, San Jose, CA, USA, 1996. 2668: 38～47
4Lienhart R, Stuber F. Automatic text recognition in digital videos[R]. Mannheim Germany: University of Mannheim, TR-95-036, 1995
5Smith M A, Kanade T. Video skimming and characterization through the combination of image and language understanding technique[A]. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, San Juan, Puerto Rico, 1997. 775～781

共引文献25

1陈艳,孙羽菲,张玉志.灰度图像中字符切分方法的研究[J].中文信息学报,2004,18(4):44-49. 被引量：11
2贾冬勤,王洪元,程起才.基于自适应阈值Canny算子的视频文本定位方法[J].常州大学学报（自然科学版）,2014,26(1):47-51. 被引量：2
3吴建国,俞庆英,吴海辉.汉字笔画若干数据的统计方法研究与应用[J].安徽大学学报（自然科学版）,2005,29(3):14-20. 被引量：14
4周祥,李正明,孙俊.轮胎胎号字符识别系统[J].计测技术,2005,25(4):21-22.
5秦姣华,向旭宇.汉字复杂指数特征提取技术的实现及其改进[J].计算机工程与设计,2006,27(2):265-267. 被引量：3
6王建宇,张峰,周献中,史迎春,骆文.利用小波变换和K均值聚类实现字幕区域分割[J].计算机辅助设计与图形学学报,2006,18(10):1508-1512. 被引量：10
7田大增,郝永,哈明虎.一种新的去除视觉文本图像椒盐噪声的算法[J].计算机工程与应用,2007,43(14):81-83. 被引量：6
8单武秋.新闻视频图像中的模式识别技术研究[J].湖南科技学院学报,2008,29(4):104-107.
9高继勋,冯云超,李燕.计算机新闻视频检索技术之字幕事件检测算法研究[J].平顶山工学院学报,2008,17(2):12-14. 被引量：1
10陶永宽,周军红,王明磊,韩冬.基于形态学操作的新闻标题检测定位方法[J].计算机仿真,2008,25(8):210-213. 被引量：1

同被引文献40

1汪孔桥.彩色图像中的字符分割[J].武汉大学学报（工学版）,2003,36(z1):160-164. 被引量：1
2程娟,平西建,周冠玮.基于多特征和SVM的文本图像版面分类方法[J].数据采集与处理,2008,23(5):569-574. 被引量：6
3童莉,平西建.基于信息度量的图像特征与文本图像分类[J].计算机工程,2004,30(17):143-145. 被引量：7
4马壮,赵国权,任占鹏.基于OCR识别技术的自动阅卷系统的研究[J].河北工业科技,2005,22(6):354-357. 被引量：3
5庄军,李弼程.一种基于灰度共生矩阵的文本图像识别方法[J].计算机工程,2006,32(3):214-216. 被引量：11
6狄红卫,薄利军.近场光学扫描显微镜图像的噪音处理[J].光子学报,2006,35(6):940-943. 被引量：2
7张宏志,张金换,岳卉,黄世霖.基于CamShift的目标跟踪算法[J].计算机工程与设计,2006,27(11):2012-2014. 被引量：56
8宋锦萍,侯玉华,杨晓艺,唐远炎.基于小波域多状态隐马尔科夫树模型的自适应文本图像分割算法[J].电子学报,2007,35(1):118-122. 被引量：12
9厉彦虎,李方祥,包大鹏,詹晖,周敬滨,王保国,李少武,尚学东,李国平.优秀乒乓球运动员、教练员57例颈椎MRI检查分析[J].中国运动医学杂志,2007,26(4):486-487. 被引量：1
10哈力旦.A,伊力哈木.亚尔买买提,库尔班.买提木沙.复杂背景下维吾尔文字符的分割算法[J].计算机工程与应用,2007,43(20):163-165. 被引量：13

引证文献5

1张煜东,吴乐南,韦耿.基于GCM与RFH的文本图像联合识别[J].信息与控制,2009,38(5):571-574. 被引量：4
2朱亚平,鲁永杰,李华.基于K均值聚类的文字分割算法研究与实现[J].计算机光盘软件与应用,2013,16(2):16-19. 被引量：4
3李凯,艾斯卡尔.艾木都拉.基于边缘和基线的维吾尔文图像文字定位算法[J].计算机工程与应用,2014,50(10):203-207. 被引量：8
4季云峰,王朝立.基于图像识别的乒乓球选手颈椎健康分析[J].计算机仿真,2015,32(4):192-196.
5刘红,许传林.试卷自适应分割算法的设计与实现[J].上海电机学院学报,2021,24(2):108-111. 被引量：2

二级引证文献18

1张煜东,朱庆,王水花,吴乐南.一种径向基函数神经网络的参数求解方法[J].计算机测量与控制,2010,18(12):2812-2814. 被引量：4
2徐璐,周亚建.基于特征恢复的中文残缺文本分类研究[J].北京电子科技学院学报,2011,19(4):23-29.
3郭晓宇,平西建,周林.基于连通区域矩阵的文本图像识别方法[J].信息工程大学学报,2012,13(3):329-333. 被引量：5
4羊斌.基于K-均值动态聚类分析的企业信用等级划分法[J].计算机光盘软件与应用,2013,16(20):69-70. 被引量：1
5姜继春,王晓红,许秦蓉.基于YCbCr颜色空间的快递单手写文字分割[J].包装工程,2014,35(5):121-125. 被引量：5
6李敏强,哈力旦.阿布都热依木,闫轲.一种改进型局部二值模式的维吾尔文定位算法[J].河南科技大学学报（自然科学版）,2015,36(3):43-47. 被引量：7
7王帮元.字符识别耦合的ROI视觉引导应用[J].湖北文理学院学报,2015,36(5):12-16.
8吴财贵,唐权华.基于深度学习的图片敏感文字检测[J].计算机工程与应用,2015,51(14):203-206. 被引量：5
9曹卫,薛煜阳.基于曲线拟合和对象选择的脱机手写维吾尔文本行切分算法[J].计算机与数字工程,2015,43(8):1375-1377.
10党红恩.藏文字形轮廓特征优化识别提取仿真研究[J].计算机仿真,2016,33(11):341-344. 被引量：6

1小鱼.巧用HyperSnap DX提高OCR识别率[J].大众软件,2005(8):70-70.
2顾徐鹏.基于AdaBoost的人脸特征挑选与特征融合算法研究[J].微型电脑应用,2011(5):11-13.
3孙永泰.运用传感器检测变压器故障[J].大众用电,2003(3):33-33.
4胡兴军.深受关注的“宽屏”数码相机[J].照相机,2004(7):32-34.
5白桦.提高OCR识别率[J].电脑知识与技术（过刊）,2004(12):52-52. 被引量：2
6田仙仙,鲍泓,徐成.一种改进HOG特征的行人检测算法[J].计算机科学,2014,41(9):320-324. 被引量：37
7聂栋栋,马利庄,肖双九.一种改进的指纹纹线方向场的计算方法[J].小型微型计算机系统,2006,27(11):2047-2051. 被引量：2
8洁盈.让OCR识别率更高[J].电脑高手,2004(3):79-79.
9王颖丽,白岩峰,杨霞.无源器件高频特性研究[J].天津化工,2016,30(2):59-62.
10陈庄金.高精度数控系统的滤波器设计[J].自动化仪表,2001,22(3):46-47.

系统仿真学报

2008年第23期

浏览历史

内容加载中请稍等...

基于边缘和颜色的视频文本图像分割方法被引量：5

参考文献9

二级参考文献5

共引文献25

同被引文献40

引证文献5

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于边缘和颜色的视频文本图像分割方法 被引量：5

参考文献9

二级参考文献5

共引文献25

同被引文献40

引证文献5

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于边缘和颜色的视频文本图像分割方法被引量：5