基于笔画相关加权的视频图像文字识别被引量：4

Video image character recognition based on stroke-related weight

下载PDF

导出

摘要为了提取影视视频图像中的字幕信息,提出一套鲁棒的方法:首先采用图像的边缘特征对字幕信息进行区域定位,并给出结合边缘信息的方法对图像文字进行二值化;其次,采用投影法和区域生成方法定位单个文字;最后,充分考虑到文字笔画的拓扑结构,进行相邻子网格笔画结构相关性的判定,并采用笔画模糊隶属度完成弹性网格特征的提取。该方法在复杂的背景图像中能够有效得到文字的二值图像,并保证了提取特征的稳定性、健壮性,对二值化后的影视字幕的识别率达到92.1%,实验结果表明了方法的有效性。 In order to extract the subtitle in the video image, a robust method was proposed. First, the image edge feature was adopted in caption location step, and the binarization method of text images with the edge information was given. Then, the method combined with projection and regional generation was used to locate a character. Finally, taking fully account of the topology of the text strokes, the stroke correlation among the adjacent sub-grids was determined and the stroke fuzzy membership was used to complete the elastic grid feature extraction. This method can effectively get the binary image of characters from a complex background image, ensure the stability and robustness in feature extraction. The experimental results show the method is effective, and its recognition rate has been up to 92.1%.

作者苏畅胡晓冬王斌辅尚凤军

机构地区重庆邮电大学计算机科学与技术学院美国康奈尔大学计算机系

出处《计算机应用》 CSCD 北大核心 2012年第8期2305-2308,2312,共5页 journal of Computer Applications

基金重庆市教委科学技术研究项目(KJ110504) 重庆市科委自然科学基金资助项目(2009BB2081) 教育部留学回国人员科研启动基金资助项目(教外司留[2010]1174)

关键词视频图像文字识别文本定位二值化子网格特征笔画相关性 video image character recognition text location binarization sub-grid feature stroke correlation

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1MERLER M, KENDER J R. Semantic keyword extraction via adaptive text binarization of unstructured unsourced video[C] // ICIP'09: Proceedings of the 16th IEEE International Conference on Image Processing. Piscataway: IEEE, 2009: 261-264.
2张佑生,彭青松,汪荣贵.一种基于变异灰度直方图的视频字幕检测定位方法[J].电子学报,2004,32(2):314-317. 被引量：11
3田破荒,彭天强,李弼程.基于文字穿越线和笔画连通性的视频文字提取方法[J].电子学报,2009,37(1):72-78. 被引量：10
4宋砚,刘安安,张勇东,林守勋.基于聚类的视频字幕提取方法[J].通信学报,2009,30(2):136-140. 被引量：10
5李闯,丁晓青,吴佑寿.基于边缘的字符串定位算法[J].清华大学学报（自然科学版）,2005,45(10):1335-1338. 被引量：1
6高学,金连文,尹俊勋.一种基于笔画密度的弹性网格特征提取方法[J].模式识别与人工智能,2002,15(3):351-354. 被引量：13
7刘伟,朱宁波,何浩智,李德鑫,孙发军.基于弹性网格模糊特征的手写体汉字识别方法[J].中文信息学报,2007,21(3):117-121. 被引量：10
8杜佳明,王朝立,朱枫.基于质心角度的字符图像识别算法[J].信息与控制,2010,39(3):320-325. 被引量：2
9林民,宋柔.一种笔段网格汉字字形描述方法[J].计算机研究与发展,2010,47(2):318-327. 被引量：13
10LYU M R, SONG J, CAI M. A comprehensive method for multilingual video text detection, localization, and extraction[J].IEEE Transactions on Circuits and Systems for Video Technology, 2005,15(2):243-255.

二级参考文献69

1杜世宏,王桥,杨一鹏.一种定性细节方向关系的表达模型[J].中国图象图形学报（A辑）,2004,9(12):1496-1503. 被引量：16
2冯志伟.用上下文无关语法来描述汉字结构[J].语言科学,2006,5(3):14-23. 被引量：9
3王开铸,王英伟.汉字字形的关系稳定原理[J].中文信息学报,1996,10(4):24-31. 被引量：3
4R Lienhart, A Wemicke. Localizing and segmenting text in images, videos [ J ]. IEEE Transactions on Circuits Syst Video Technol, 2002,12(4) :256 - 268.
5Agnihotri L, Dimitrova N. Text detection for video analysis [ A]. IEEE Workshop on Content-Based Access of Image and Video Libraries [C ]. Fort Collins, CO, USA: IEEE Press, 1999.109 - 113.
6K Jain, B Yu. Automatic text location in images and video frames[ J]. Pattern recognition, 1998,31(12) :2055 - 2076.
7Wenge Mao,Fu-lai Chung,Lam, K K M, Wan-chi Sun.Hybrid Chinese/English text detection in images and video frames [ A]. Proceedings of 16th International Conference on Pattern Recognition, 2002 [C ]. Washington, DC, USA: IEEE Computer Society,Volume (3) ,Aug 2002. 1015 - 1018.
8J Gllavata, R Ewerth, B Freisleben. A text detection, localization and segmentation system for OCR in images[A]. Proceedings of the 1EEE Sixth International Symposium on Multimedia Software Engineering[ C]. Washington, DC, USA :IEEE Computer Society,2004.310 - 317.
9Michael R Lyu, Jiqiang Song, Min Cal. A comprehensive method for multilingual video text detection, localization, and extraction[J ]. IEEE Transaction on circuits and systems for video technology, 2005,15(2) :243 - 255.
10D Chen,K Shearer,H Bourlard. Text enhancement with asymmelric filter for vdeo OCR[A]. In Proceedings of 11 th International Conference Image Analysis Processing [ C ]. Palermo, I taly: IEEE Press,2001,192 - 197.

共引文献66

1霍春宝,杨闯,佟智波,杨红喆,王丹丹.OCR下的改进SIFT人脸识别算法[J].辽宁工程技术大学学报（自然科学版）,2021,40(4):378-382. 被引量：5
2金连文,高学.几种手写体汉字网格方向特征提取法的比较研究[J].计算机应用研究,2004,21(11):38-40. 被引量：10
3汪荣贵,张佑生,高隽,彭青松,胡良梅.Bayes网络学习及其在文本检测中的应用研究[J].复旦学报（自然科学版）,2004,43(5):733-736.
4汪荣贵,高隽,张佑生,彭青松.一种新的Bayes网络条件概率学习方法[J].中国科学技术大学学报,2005,35(5):701-710. 被引量：1
5王建平,蔺菲.基于笔划宽度提取的手写体汉字归一化方法[J].计算机技术与发展,2006,16(10):29-31. 被引量：2
6曾水玲,徐蔚鸿.基于支持向量机的手写体数字识别[J].计算机与数字工程,2006,34(10):104-106. 被引量：9
7田破荒,李弼程,彭天强.一种有效的视频文字提取方法[J].电视技术,2007,31(10):87-89. 被引量：1
8何志国,曹玉东.脱机手写体汉字识别综述[J].计算机工程,2008,34(15):201-204. 被引量：9
9袁海东,马华东,黄晓冬.基于梯度与粗糙度的视频文本检测与定位[J].电子学报,2008,36(8):1660-1664. 被引量：9
10陈腊梅,陈斌,陈家辉.图像扇形特征及其应用[J].计算机应用,2008,28(11):2896-2899.

同被引文献59

1李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
2曹阳,高志远,杨胜春,姚建国,梁云,孙云枫.云计算模式在电力调度系统中的应用[J].中国电力,2012,45(6):14-17. 被引量：37
3王水平,唐振民,陈北京,蒋晔.复杂环境下语音增强的复平面谱减法[J].南京理工大学学报,2013,37(6):857-862. 被引量：6
4梁华刚,程加乐,茹锋.基于特征空间法的旋转多字体文字识别[J].微电子学与计算机,2015,32(4):82-85. 被引量：3
5董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量：98
6Hinton G E, Salakhutdinov R R.Reducing the dimension- ality of data with neural networks[J].Science, 2006,313 : 504-507.
7WIDMER A. SCHAER R, MARKONIS D, et al. Facilitating medical information search using Google Glass connected to a content-based medical retrieval system [C]//36th Annual International Conference of the IEEE, Chicago, USA, 2014.
8TEIXEIRAJM F, FERREIRAR D, SANTOSM P, et al. Tele-operation using Google glass and AR, Drone for structural inspection [C]//Virtual and Augmented Reality, Piata Salvador, 2014.
9SILVAM L, FREITASD C, MARCEL P, et ol. Tele-operation using Google glass and AR, drone for structural inspection[C]// Virtual and Augmented Reality, Piata Salvador, 2014.
10WILLEM W, SCHOLLPM M, WISCHNIEWSKIS A, et al. Comparing Google glass with tablet-PC as guidance system for assembling tasks [C]//Wearable and Implantable Body Sensor Networks Workshops, Zurich, 2014.

引证文献4

1吴财贵,唐权华.基于深度学习的图片敏感文字检测[J].计算机工程与应用,2015,51(14):203-206. 被引量：4
2董晓峰,顾晓文,王业,朱国防.电网倒闸操作票智能监护系统设计[J].中国电力,2015,48(12):16-22. 被引量：12
3林毅斌,姚剑敏,郭太良.基于神经网络与比例法的多文字识别[J].电视技术,2016,40(9):112-116.
4吴克介.煤矿安全监控系统领域知识图谱构建及应用研究[J].煤炭技术,2024,43(4):238-242. 被引量：1

二级引证文献17

1董婷,赵俭辉,胡勇.基于时空优化深度神经网络的AQI等级预测[J].计算机工程与应用,2017,53(21):17-23. 被引量：7
2黄冬梅,许琼琼,贺琪,杜艳玲.融合多特征的深度学习标注方法[J].计算机工程与应用,2018,54(1):224-228. 被引量：12
3彭云华.探究变电运行倒闸作业误操作的防范和预控[J].科技尚品,2017,0(8):214-214.
4郝稚宇.智能穿戴在基础设施安全防护中的应用[J].信息通信,2018,31(1):207-209. 被引量：3
5石伟钊.电网倒闸操作智能导航系统[J].农村电气化,2018(7):46-48.
6刘伟,何瑶,仵晨阳,张悦健,张滏钰.一种面向网络安全的图像文字敏感词过滤方法[J].西安邮电大学学报,2018,23(4):89-93. 被引量：5
7钱红兵,李艳丽,张蕊.WebCollector和ElasticSearch在高校网站群敏感词检测中的应用研究[J].电子设计工程,2019,27(24):11-14. 被引量：2
8包威,黄家豪,朱昊,黄晓瀚.一种500 kV变电站典型操作风险管控手册的制定及应用[J].机电信息,2020(2):112-113.
9杜凡,莫熙,蒋迪.电网倒闸操作多功能智能索引系统设计与实现[J].工业仪表与自动化装置,2020(1):46-49. 被引量：4
10张建军.数字化电子操作票促班组安全[J].电力安全技术,2021,23(6):74-76. 被引量：1

1杨晟院,舒适.一种基于特征线的曲面网格分割方法[J].计算机工程与应用,2008,44(26):166-167. 被引量：2
2张丽,胡颖.基于网格和密度的数据流聚类算法[J].郑州轻工业学院学报（自然科学版）,2010,25(4):75-78.
3张丽,胡颖.基于网格和密度的数据流聚类算法[J].商丘师范学院学报,2011,27(3):70-73.
4曾凡锋,付亚南.基于文字笔画结构的文本图像校正处理[J].无线互联科技,2014,11(2):61-63.
5应用数学[J].中国学术期刊文摘,2009,15(1):16-17.
6NicholasPurday MikeBenefiel 谢力.原子网格———种优化油田开发和快速生成远景的新技术[J].国外石油动态,2005(9):25-30.
7宋建才.汽车牌照识别技术研究[J].工业控制计算机,2004,17(4):44-45. 被引量：25
8相框DIY 其实很简单[J].电脑迷,2006,0(13):11-11.
9袁磊,张浩.基于网格技术的协同管理平台的构建与模式研究[J].微型机与应用,2004,23(12):42-45.
10苏芳芳,王成,陈维斌,张玉侠.相似度最优加权协同过滤推荐模型[J].小型微型计算机系统,2016,37(4):682-686. 被引量：2

计算机应用

2012年第8期

浏览历史

内容加载中请稍等...

基于笔画相关加权的视频图像文字识别被引量：4

参考文献12

二级参考文献69

共引文献66

同被引文献59

引证文献4

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于笔画相关加权的视频图像文字识别 被引量：4

参考文献12

二级参考文献69

共引文献66

同被引文献59

引证文献4

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于笔画相关加权的视频图像文字识别被引量：4