数字视频中字幕检测及提取的研究和实现被引量：16

Digital Video Caption Detection and Extraction Techniques and Implementation

下载PDF

导出

摘要首先进行文字事件检测 ,然后进行边缘检测、阈值计算和边缘尺寸限制 ,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕提出的叠加水平和垂直方向边缘的方法 ,加强了检测到的文字的边缘 ;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘 ;进一步 ,提出像素密度α的概念 ,并指出文字区域的像素密度α应在某一阈值范围之内 (αmin≤α≤αmax) 通过像素密度α滤去了非文字区域 ,应用投影法最终确定视频字幕所在区域以上方法的结合保证了提出的算法的正确率和鲁棒性选用不同类型的视频素材对文中算法进行实验 ,并与其他方法进行比较。 In order to extract caption region in digital video, an algorithm is provided which first detects text event and gets edges, then makes a size restrict to the edges and eventually wipes off non text regions according to the textual energy The overlaying of detected horizontal edges and vertical edges enhances the text edges; the size restrict of edges helps to wipe off the non text edges The conception of pixel density α is presented in a threshold scope( α min ≤ α≤α max ) and used as an auxiliary measure to wipe off texture like regions Eventually image projection is applied to get text regions The combination of these methods guarantees the performance of this algorithm Our experiments show that this arithmetic has satisfactory performance of correctness and computing speed

作者蔡波周洞汝胡宏斌

机构地区武汉大学计算机学院

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2003年第7期898-903,共6页 Journal of Computer-Aided Design & Computer Graphics

基金国家电力公司科学基金 (SPKJ 0 16 0 71)资助

关键词数字视频字幕检测像素密度鲁棒性文字提取 detection of text event digital video caption extraction edge detection textual energy

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Ohya J, Shio A, Akamatsu S. Recognizing characters in scene images [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1994, 16(7): 214～224
2Lopresti D, Zhou J. Document analysis and the world wide web[A]. In: Proceedings of International Workshop on Document Analysis Systems, Malvern, PA, 1996. 651～669
3Yeo B L, Liu B. Visual content highlighting via automatic extraction of embedded captions on MPEG compressed video [A]. In: Proceedings of SPIE Digital Video Compression: Algorithms and Technology, San Jose, CA, USA, 1996. 2668: 38～47
4Lienhart R, Stuber F. Automatic text recognition in digital videos[R]. Mannheim Germany: University of Mannheim, TR-95-036, 1995
5Smith M A, Kanade T. Video skimming and characterization through the combination of image and language understanding technique[A]. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, San Juan, Puerto Rico, 1997. 775～781

同被引文献119

1李默,李弼程,苏大伟.新闻视频中标题条检测及文字内容提取算法[J].电视技术,2005,29(z1):147-149. 被引量：3
2彭培华,曲波,陈荣胜.基于支持向量机的小波域视频字幕检测与提取[J].华南理工大学学报（自然科学版）,2004,32(z1):63-66. 被引量：4
3李江川,李尧.视频字幕检测的新方法[J].控制工程,2011,18(S1):30-33. 被引量：2
4王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
5于俊清,汤旸,周向东.基于主色特征识别的新闻视频口播帧[J].计算机工程与科学,2004,26(8):28-31. 被引量：3
6谢毓湘,栾悉道,吴玲达,老松杨.新闻视频帧中的字幕探测[J].计算机工程,2004,30(20):167-168. 被引量：15
7杨有山,张秀丽.基于内容的视频信息检索[J].北京广播学院学报（自然科学版）,2004,11(4):24-32. 被引量：4
8章东平,祝金标,刘济林.自动定位彩色图像中的文本[J].浙江大学学报（工学版）,2005,39(2):229-233. 被引量：5
9李朝晖,余英林.一种视频文本自动定位、跟踪和识别的方法[J].中国图象图形学报（A辑）,2005,10(4):457-462. 被引量：7
10李默,李弼程,邓子健.新闻视频主持人镜头的半屏幕检测算法[J].计算机工程与应用,2005,41(15):183-185. 被引量：4

引证文献16

1贾冬勤,王洪元,程起才.基于自适应阈值Canny算子的视频文本定位方法[J].常州大学学报（自然科学版）,2014,26(1):47-51. 被引量：2
2王建宇,张峰,周献中,史迎春,骆文.利用小波变换和K均值聚类实现字幕区域分割[J].计算机辅助设计与图形学学报,2006,18(10):1508-1512. 被引量：10
3单武秋.新闻视频图像中的模式识别技术研究[J].湖南科技学院学报,2008,29(4):104-107.
4高继勋,冯云超,李燕.计算机新闻视频检索技术之字幕事件检测算法研究[J].平顶山工学院学报,2008,17(2):12-14. 被引量：1
5陶永宽,周军红,王明磊,韩冬.基于形态学操作的新闻标题检测定位方法[J].计算机仿真,2008,25(8):210-213. 被引量：1
6朱成军,欧阳元新,盛浩,熊璋.基于边缘和颜色的视频文本图像分割方法[J].系统仿真学报,2008,20(23):6498-6501. 被引量：5
7李芳,吴斌,张红英.基于快速8-连通域标记的视频字幕提取新算法[J].电视技术,2009,33(2):69-71. 被引量：9
8昝蕊,胡静波.基于小波的视频图像字幕定位[J].长春工业大学学报,2009,30(4):379-384.
9赵亚琴.一种有效的新闻视频主题字幕检测方法[J].计算机工程与应用,2009,45(33):175-178. 被引量：5
10陈树越,张世林.基于灰度差分的新闻视频标题字幕探测[J].计算机与数字工程,2010,38(11):145-147.

二级引证文献40

1朱成军,蒲菊华,薛玲,熊璋.基于词组学习的视频文本检测方法[J].计算机工程,2008,34(13):185-187. 被引量：4
2张煜东,吴乐南,韦耿.基于GCM与RFH的文本图像联合识别[J].信息与控制,2009,38(5):571-574. 被引量：4
3郑百源,程远增,任锁柱,石彦召.基于DM642的数字图像处理的弹目偏差提取[J].太原理工大学学报,2010(1):19-23. 被引量：3
4陈茜,赵进创.滚动字幕条件下的新闻视频检索研究[J].中国有线电视,2010(3):296-299.
5张玉珍,魏带娣,王建宇,戴跃伟.基于多模态融合的足球视频语义分析[J].计算机科学,2010,37(7):273-276. 被引量：3
6陈树越,张世林.基于灰度差分的新闻视频标题字幕探测[J].计算机与数字工程,2010,38(11):145-147.
7陈树越,张世林.基于灰度差分与变异直方图的新闻标题字幕探测[J].常州大学学报（自然科学版）,2010,22(4):43-46.
8金一初,马燕.奶牛图像的分割算法研究[J].电子设计工程,2011,19(2):81-84. 被引量：1
9甘玲,林小晶.基于连通域提取的车牌字符分割算法[J].计算机仿真,2011,28(4):336-339. 被引量：52
10吴进.视频帧中字幕信息提取的区域检测算法研究[J].电视技术,2011,35(11):118-120. 被引量：1

1陈文婷,李磊,杨盈昀.卡拉OK字幕的检测与定位[J].中国传媒大学学报（自然科学版）,2008,15(2):71-76.
2陈义,李言俊,孙小炜.利用OCR识别技术实现视频中文字的提取[J].计算机工程与应用,2010,46(10):180-183. 被引量：21
3意料中的惊喜 Nokia Lumia920和Nokia Lumia820[J].数码精品世界,2012(10):13-13.
4精品秀[J].中国信息化,2014(5):38-39.
5超值8英寸高分屏平板昂达V801双核版[J].电脑迷,2012(10):39-39.
6IDEALENS日本发布VR一体机K2[J].微型计算机,2016,0(19):47-47.
7乐享视觉盛宴[J].电脑时空,2014(5):37-37.
84K显示时代优派VP3280显示器[J].数码设计,2013(5):31-31.
9秒杀三星Note 2LG发布Optimus G Pro[J].电脑爱好者,2013(6):82-82.
10嵌入式系统[J].电子产品世界,2012,19(2):77-77.

计算机辅助设计与图形学学报

2003年第7期

浏览历史

内容加载中请稍等...

数字视频中字幕检测及提取的研究和实现被引量：16

参考文献5

同被引文献119

引证文献16

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

数字视频中字幕检测及提取的研究和实现 被引量：16

参考文献5

同被引文献119

引证文献16

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

数字视频中字幕检测及提取的研究和实现被引量：16