视频信号中实时字幕信息的提取方法被引量：8

Real-time text information extraction from videos

导出

摘要为了在视频图像中进行字幕信息的实时提取 ,提出了一套简捷而有效的方法。利用视频图像中文本的频率特性与空间连续性 ,采用改进的投影阈值分割方法对视频中的文本进行实时分割。针对视频字幕在时间上的冗余特性 ,提出了一个基于有限状态机的动态缓冲的模型 ,在提高分割的正确率的同时减小了识别运算量。在识别部分 ,采用了一个 3层前向神经网络进行实时的识别。该算法已经成功地应用于卡拉 OK MTV歌词字幕信息同步提取系统中。 A simple and effective method is presented for real time text segmentation and recognition in videos. The frequeny and spatial characteristics of the text are analyzed by a fast segmentation algorithm developed from the conventional threshold method. A dynamic buffering algorithm based on the Finite State Machine is used to eliminate the text's temporal redundancy and at the same time to correct segmentation errors. The recognition algorithm employs a 3 layer BP NN for real time recognition. The algorithms have been successfully applied to a system which automatically extracts lyrics from MTV Karaoke videos.

作者欧国斌张利谢攀

机构地区清华大学电子工程系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2002年第7期869-872,共4页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金资助项目 (60 172 0 2 7)

关键词视频信号图像分割视频图像识别动态缓冲分裂合并特征提取 segmentation recognition video dynamic buffering splitting merging finite state machine

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1章毓晋.图像处理和分析[M].清华大学出版社,1999,3..

共引文献145

1靳雁霞.数字图像的灰度处理[J].测试技术学报,2004,18(z2):97-100. 被引量：1
2赵庆军,胡青泥.基于局部图像锐化的自适应模糊边缘检测算法[J].电脑开发与应用,2004,17(9):40-42. 被引量：1
3蒋晓悦,赵荣椿.一种改进的活动轮廓图像分割技术[J].中国图象图形学报（A辑）,2004,9(9):1019-1024. 被引量：7
4程建,施广富,杨杰.固体火箭发动机地面试验故障图像的目标检测[J].固体火箭技术,2004,27(2):157-160. 被引量：1
5蔡国斌,张学俊,乌建中.数字图像处理技术在建筑物准直领域的应用[J].中国科教博览,2004(11):75-77.
6罗若愚,鲁强,曾绍群.在医学图像处理中使用MMX及SSE指令[J].计算机应用研究,2005,22(1):239-242. 被引量：5
7尚会超,陈幼平,余文勇,周祖德.印刷字符在线检测的预处理算法及试验研究[J].计算机应用研究,2005,22(1):243-245. 被引量：1
8王晖,卢健.基于预测的边缘检测方法[J].武汉大学学报（信息科学版）,2005,30(1):23-26. 被引量：3
9杨丽,张铁中,罗辉.基于机器视觉的组织培养苗自动识别技术[J].农业机械学报,2005,36(1):87-91. 被引量：5
10周军其,薛存金,孙家抦.基于修正后直方图不变矩的符号图像变化检测[J].武汉大学学报（信息科学版）,2005,30(2):150-153. 被引量：1

同被引文献41

1谢毓湘,栾悉道,吴玲达,老松杨.新闻视频帧中的字幕探测[J].计算机工程,2004,30(20):167-168. 被引量：15
2罗钟铉,刘成明.灰度图像匹配的快速算法[J].计算机辅助设计与图形学学报,2005,17(5):966-970. 被引量：72
3秦姣华,向旭宇.汉字复杂指数特征提取技术的实现及其改进[J].计算机工程与设计,2006,27(2):265-267. 被引量：3
4蓝照华,赵进创.新闻视频检索技术的研究[J].中国有线电视,2006(24):2414-2416. 被引量：1
5李治强,杨强.基于时空分布特征的新闻字幕检测改进算法[J].广播与电视技术,2007,34(2):103-105. 被引量：3
6Young-tae, Kim. Retrieval of News Video using Video Sequence Matching[J]. Proceedings of the l lth International Multimedia Modelling Conference (MMM' 05),IEEE,2005: 68 - 75.
7Rainer Lienhart Video OCR: a survey and practitioner' guide[R].95052-8119, Intel Corporation, Microprocessor Research Labs, Santa Clara, CA, USA, 2003.
8Julinda Gllavata, Ralph Ewerth, Bernd Freislebrn. Tracking Text in MPEG Videos[J]. Proceedings of the 12th annual ACM international conlerence on Multimedia(MM' 04), New York, NY, USA , 2004:240 243.
9Wong E. K., Chen M.. A new robust algorithm for video text extraction[J]. Pattern Recognition, 2003, 36 (6): 1397 - 1406.
10飞机平视显示器通用规范[S],GJB189-86.

引证文献8

1史迎春,王韬,周献中.一种基于时空分布特征的新闻字幕检测新算法[J].系统仿真学报,2004,16(11):2483-2485. 被引量：5
2杨强,程玉昆,马森.基于时空分布特征和SVM方法的视频汉字提取与识别[J].苏州科技学院学报（工程技术版）,2007,20(4):78-80.
3杨强,程玉昆,马森.基于小波变换和相似性度量的视频文字识别[J].计算机工程与设计,2008,29(9):2307-2308. 被引量：1
4蓝照华,梁永忠.基于字幕的新闻视频检索算法[J].广播与电视技术,2010(5):64-66.
5杨建新.平显记录视频中的刻度带信息提取研究[J].自动化技术与应用,2011,30(10):48-50.
6洪宗海.英语DVD图形字幕的提取与转换[J].软件,2011,32(10):79-83.
7郭红转,李娜,路新华.航空图像的三维目标图像重建过程的仿真分析[J].计算机仿真,2015,32(7):42-45.
8吴卫玲,杨建新.基于机器视觉原理的平显视频信息提取研究[J].仪表技术,2017(4):18-20.

二级引证文献6

1蓝照华,赵进创.新闻视频检索技术的研究[J].中国有线电视,2006(24):2414-2416. 被引量：1
2李治强,杨强.基于时空分布特征的新闻字幕检测改进算法[J].广播与电视技术,2007,34(2):103-105. 被引量：3
3刘元春,凌坚,练益群.电视新闻节目中标题字幕的提取技术探索[J].广播与电视技术,2008,35(11):91-92. 被引量：1
4钮燕.一种新的视频文本定位方法[J].科技信息,2011(27).
5宋伟,刘洪亮,纳鹏宇,李明.相似性测度函数分析及其在图像匹配中的应用研究[J].中央民族大学学报（自然科学版）,2014,23(1):44-49. 被引量：3
6王亚,褚晶辉,刘子玉,吕卫.支持多种文字的视频字幕叠加工具设计[J].信息技术,2015,39(9):118-120.

1姜静,曹彦.基于四叉树和特征融合的图像特征提取的研究[J].洛阳师范学院学报,2014,33(11):55-56. 被引量：3
2视频图像识别分析软件简析[J].A&S（安防工程商）,2007(1):94-97.
3官洪运,许广洋,于融正.基于云端的视频图像识别系统的实现[J].微型机与应用,2016,35(22):51-53. 被引量：4
4黄猛,唐琳,胡世安,张搏.一种改进的分裂合并图像分割算法[J].现代电子技术,2009,32(22):102-105. 被引量：3
5曹水,周炜,乔永刚,徐公权.基于动态缓冲的实时同步策略[J].计算机工程与应用,2001,37(11):85-87. 被引量：1
6视频图像识别分析软件掀开监控新篇章[J].A&S（安全&自动化）,2007(2):141-141.
7江晓锋.人脸识别智能分析产品的应用[J].电子技术与软件工程,2014(9):114-114.
8沈文文(整理).视频图像识别分析软件掀开监控新篇章[J].A&S（安防工程商）,2007(1):88-92.
9贺霄琛,韩燮,李顺增.改进的LB算法在动态手势识别中的应用[J].微电子学与计算机,2016,33(4):55-59. 被引量：4
10褚景尧,张刚.视频压缩数据流实时分割的软件实现[J].太原理工大学学报,2003,34(3):246-247. 被引量：3

清华大学学报（自然科学版）

2002年第7期

浏览历史

内容加载中请稍等...

视频信号中实时字幕信息的提取方法被引量：8

参考文献1

共引文献145

同被引文献41

引证文献8

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

视频信号中实时字幕信息的提取方法 被引量：8

参考文献1

共引文献145

同被引文献41

引证文献8

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

视频信号中实时字幕信息的提取方法被引量：8