基于多尺度图像融合的新闻视频文字区域检测定位算法

Automatic Text Detection in News Video Based on Multi-Resolution Image Fusion

下载PDF

导出

摘要针对新闻视频中的文字区域检测定位问题,研究了如何快速有效地检测新闻视频中的文字区域,用以实现自动视频检索。为克服视频中文字大小不一的难题,根据视频图像中文字区域特征有别于背景区域的特点,提出了一种基于多尺度图像融合的新闻视频文字区域检测定位算法。算法主要采用训练和学习两个步骤,首先对人为收集的含字符样本与不含字符样本进行小波特征和局部二值模式等特征提取,并完成SVM分类器训练,获取分类器;然后对测试视频帧进行多尺度的遍历检测,并融合检测结果,获取每帧的文字区域。实验结果表明,与前人提出的基于边缘检测的方法相比,算法具有明显优越性,在定位准确度上有较大提高,同时还能克服视频帧之间的快速变换,具有一定的实用意义。 As to the problem of automatic text detection in news video, an efficient algorithm was proposed for text location and video searching. In order to overcome the challenge of the different size of text in news video frames, an algorithm which was based on multi-resolution The method includes two steps ： firstly, the wavelet feature image fusion and text block feature was presented. and LBP feature of positive samples and negative sam- ples were extracted which can be trained by support vector machine （SVM）. And then, the test video for text detection should be ergoticly detected by multi-resolution method. Finally, the result image of text detection can be gained by multi-resolution image fusion. The experimental results show that this method has the superiority of accuracy rating compared with the traditional method based on edge detection, so that the video frames are trans- formed quickly

作者章慧赵丽娟

机构地区淮阴工学院计算机工程学院

出处《贵州大学学报（自然科学版）》 2012年第6期86-90,共5页 Journal of Guizhou University:Natural Sciences

基金国家自然科学基金(No.60973113) 淮安市工业科技支撑项目(HAG2010069)

关键词小波特征提取局部二值模式特征文字定位多尺度融合 wavelet feature eLBP text detection multi-resolution fusion

分类号 TP317.2 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1梁学战,张翔,朱明.基于边缘检测和线条特征的新闻字幕探测[J].计算机仿真,2009,26(3):223-226. 被引量：3
2刘海涛,老松杨,郭金林,白亮.一种快速新闻视频标题字幕探测与定位方法[J].计算机应用研究,2011,28(8):3148-3150. 被引量：1
3JAIN K,YU B. Automatic text localization in images and video frames text recognition for video indexing[J].Multimedia Systems,2000,(01):69-81.
4庄越挺,刘骏伟,吴飞,潘云鹤,张引.基于支持向量机的视频字幕自动定位与提取[J].计算机辅助设计与图形学学报,2002,14(8):750-753. 被引量：38
5GUO Jin-lin,LAO Song-yang,LIU Hai-tao. Localizing and extractin caption in news video using multi-frame average[A].2008.46-52.

二级参考文献28

1王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
2谢毓湘,栾悉道,吴玲达,老松杨.新闻视频帧中的字幕探测[J].计算机工程,2004,30(20):167-168. 被引量：15
3刘洋,薛向阳,路红,郭跃飞.一种基于边缘检测和线条特征的视频字符检测算法[J].计算机学报,2005,28(3):427-432. 被引量：20
4Xiaoqing Liu, Jagath Samarabandu. An Edge - based Text Region Extraction Algorithm for Indoor Mobile Robot Navigation[J]. IEEE International Conference on Mechatronics & Automation Niagara Falls, Canada July 200.5. 701 - 706.
5Xiaoqing Liu and Jagath Samarabandu. Multiscal Edge - based Text Extraction From Complex Images [J].IEEE ICME 2006. 1721 - 1723.
6[美] Rafael C Gonzalez, Richard E Woods, Steven L Eddins 著,阮秋琦,等译.数字图像处理[M].北京:电子工业出版社,2005.
7[1]Y Wang, Z Liu, J Huang. Multimedia content analysis using audio and visual information[J]. IEEE Signal Processing Magazine, 2000, 17(6):12～36
8[2]R Lienhart, F Stuber. Automatic text recognition in digital videos[A]. In: Proceedings of ACM Multimedia, Boston, 1996.11～20
9[3]Zhong Yu, Zhang Hongjiang, Jain Anil K. Automatic caption localization in compressed video[J]. Pattern Analysis and Machine Intelligence, 2000, 22(4):385～392
10[4]V Vapnik. The Nature of Statistical Learning Theory[M]. New York: Springer, 1995

共引文献37

1王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
2古红英,潘红,吴飞,庄越挺,潘云鹤.虹膜自相似性识别方法研究[J].计算机辅助设计与图形学学报,2004,16(7):973-977. 被引量：7
3余棉水,黎绍发.基于边缘与SVM的车牌自动定位与提取[J].计算机应用研究,2004,21(10):131-133. 被引量：8
4史迎春,周献中,方鹏飞.综合利用形状和颜色特征的台标识别[J].模式识别与人工智能,2005,18(2):216-222. 被引量：13
5周献中,史迎春,王韬.基于HSV颜色空间加权Hu不变矩的台标识别[J].南京理工大学学报,2005,29(3):363-367. 被引量：11
6王建宇,张峰,周献中,史迎春,骆文.利用小波变换和K均值聚类实现字幕区域分割[J].计算机辅助设计与图形学学报,2006,18(10):1508-1512. 被引量：10
7朱成军,李超,熊璋.视频文本检测和识别技术研究[J].计算机工程,2007,33(10):218-219. 被引量：11
8王健,王晨.基于静态图片的文本提取技术的研究[J].延边大学学报（自然科学版）,2007,33(2):124-128. 被引量：3
9刘勇,孙焘,李琛,冯林.自然场景下标志牌文本的提取[J].现代电子技术,2007,30(23):112-114. 被引量：1
10单武秋.新闻视频图像中的模式识别技术研究[J].湖南科技学院学报,2008,29(4):104-107.

1赵振勇,王保华,王力,崔磊.人脸图像的特征提取[J].计算机技术与发展,2007,17(5):221-224. 被引量：18
2哈力旦.A,库尔班.买提木沙.基于小波变换的图像中维吾尔文字定位[J].计算机工程,2011,37(8):197-198. 被引量：10
3王勇,燕继坤,郑辉.一种自适应的视频帧中字幕检测定位方法[J].计算机应用,2004,24(1):134-135. 被引量：5
4王云松.基于小波特征提取和概率神经网络的机械故障诊断[J].江苏技术师范学院学报,2011,17(6):20-24.
5高荣华,鞠金东,马立玲,曹清洁.基于2维滤波的图像定位[J].河北师范大学学报（自然科学版）,2004,28(2):136-138.
6宁仲,唐雁,张宏,陈睿,陈强.一种基于频域纹理特征的图像文字定位算法[J].四川大学学报（自然科学版）,2014,51(2):306-312. 被引量：2
7严江江,丁明跃,周成平.一种基于对数极坐标变换的快速目标识别算法[J].智能系统学报,2008,3(4):370-376. 被引量：4
8王春生.快速变换用户身份[J].网管员世界,2007(3):73-74.
9李彦璇,王蓉.基于Gabor小波特征提取的PCA人脸识别方法[J].电脑知识与技术（过刊）,2015,21(11X):138-141. 被引量：6
10石晓龙,许志榜,许进.基于径向基函数网络的显微结构下目标三维测量[J].微计算机信息,2006(09S):269-270. 被引量：2

贵州大学学报（自然科学版）

2012年第6期

浏览历史

内容加载中请稍等...

基于多尺度图像融合的新闻视频文字区域检测定位算法

参考文献5

二级参考文献28

共引文献37

相关作者

相关机构

相关主题

浏览历史