期刊文献+

视频信号中实时字幕信息的提取方法 被引量:8

Real-time text information extraction from videos
原文传递
导出
摘要 为了在视频图像中进行字幕信息的实时提取 ,提出了一套简捷而有效的方法。利用视频图像中文本的频率特性与空间连续性 ,采用改进的投影阈值分割方法对视频中的文本进行实时分割。针对视频字幕在时间上的冗余特性 ,提出了一个基于有限状态机的动态缓冲的模型 ,在提高分割的正确率的同时减小了识别运算量。在识别部分 ,采用了一个 3层前向神经网络进行实时的识别。该算法已经成功地应用于卡拉 OK MTV歌词字幕信息同步提取系统中。 A simple and effective method is presented for real time text segmentation and recognition in videos. The frequeny and spatial characteristics of the text are analyzed by a fast segmentation algorithm developed from the conventional threshold method. A dynamic buffering algorithm based on the Finite State Machine is used to eliminate the text's temporal redundancy and at the same time to correct segmentation errors. The recognition algorithm employs a 3 layer BP NN for real time recognition. The algorithms have been successfully applied to a system which automatically extracts lyrics from MTV Karaoke videos.
出处 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第7期869-872,共4页 Journal of Tsinghua University(Science and Technology)
基金 国家自然科学基金资助项目 (60 172 0 2 7)
关键词 视频信号 图像分割 视频图像识别 动态缓冲 分裂合并 特征提取 segmentation recognition video dynamic buffering splitting merging finite state machine
  • 相关文献

参考文献1

  • 1章毓晋.图像处理和分析[M].清华大学出版社,1999,3..

共引文献145

同被引文献41

引证文献8

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部