基于深度学习法的视频文本区域定位与识别被引量：11

Area Location and Recognition of Video Text Based on Depth Learning Method

下载PDF

导出

摘要通过对视频图像进行快速、准确的文本定位与识别,有利于提高视频信息处理的效率与准确率.采用Gabor滤波器实现在横、竖、撇、捺四个方向上的视频图像的纹理特征的提取,再通过RBM逐层增量深度学习算法构建深度置信网络,实现对提取的纹理特征图像中文本区域的定位.论文同时研究了利用形态学处理方法和OCR字符库实现对视频图像文本识别的可行性,并分析了识别效果.测试结果表明,本文提出的深度学习算法与形态学字符识别方法相结合,不但能够实现对视频图像文本区域的准确定位,还有利于提高字符识别的效率和准确率. It is advantageous to improve the efficiency and accuracy of video information processing through fast and accurate text area location and recognition of video images.The Gabor filter has been used to extract the texture features of video images in the four directions of horizontal,vertical,left-failing and right-falling.Then,by RBM layer increment depth learning algorithm,a depth belief network has been structured,and at the same time,the text region location for the texture feature images has been realized.The paper also studied the feasibility and recognition effect about using morphological process and OCR character database to realize the video image text recognition.The test results showed that the proposed optimized depth learning algorithm combining with morphology character recognition method can not only realize the accurate location of the text region for video images,but also improve the efficiency and accuracy of the character recognition.

作者刘明珠郑云非樊金斐于芳

机构地区哈尔滨理工大学测控技术与通信工程学院吉林省德惠市教育技术服务中心

出处《哈尔滨理工大学学报》 CAS 北大核心 2016年第6期61-66,共6页 Journal of Harbin University of Science and Technology

基金国家自然科学基金(61401126)

关键词深度学习算法视频图像文本区域定位形态学去噪字符识别 depth learning algorithm video image text area location morphological denoising character recognition

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1胡正平,王瑾.多尺度-方向笔画结合SVM验证的文字区域定位[J].仪器仪表学报,2010,31(4):916-922. 被引量：2
2付平,李孟,尹洪涛.基于Gabor滤波器的数字文档图像文字提取算法[J].电子学报,2006,34(B12):2387-2390. 被引量：4
3李抵非,田地,胡雄伟.基于深度学习的中文标准文献语言模型[J].吉林大学学报（工学版）,2015,45(2):596-599. 被引量：11
4刘洋,薛向阳,路红,郭跃飞.一种基于边缘检测和线条特征的视频字符检测算法[J].计算机学报,2005,28(3):427-432. 被引量：20
5葛晓菁,张宏喜,李兰英.图像检索中纹理特征提取的研究[J].哈尔滨理工大学学报,2005,10(1):122-124. 被引量：10

二级参考文献43

1刘洋,薛向阳,路红,郭跃飞.一种基于边缘检测和线条特征的视频字符检测算法[J].计算机学报,2005,28(3):427-432. 被引量：20
2孙慧平,刘党辉,沈兰荪.基于DCT压缩域的快速字符定位算法研究[J].电子学报,2006,34(4):751-754. 被引量：4
3黄剑华,吴锐,刘家锋,唐降龙.一种基于同质映射的视频图像中文本检测方法[J].高技术通讯,2007,17(3):249-254. 被引量：1
4LIU H,WU Q,ZHANG H B.Skew detection for complex document images using robust borderlines in both text and non-text regions[J].Pattern Recognition Letters,2008,29(13):1893-1900.
5VIET C D,SEONG S C,SEUNGWOOK C.An efficient method for text detection in video based on stroke width similarity[C].Proceeding of the 8th Asian conference on computer vision,2007(1):200-209.
6QIAN X M,LIU G ZH,WANG H,et al.Text detection,localization,and tracking in compressed video[J].Signal Processing:Image Communication,2007,22(9):752-768.
7LI SH T,SHEN Q H,SUN J.Skew detection using wavelet decomposition and projection profile analysis[J].Pattern Recognition letters,2007,28(5):555-562.
8LIU X B,FU H,JIA Y D.Gaussian mixture modeling and learning of neighboring characters for multilingual text extraction in images[J].Pattern Recognition,2008,41(2):484-493.
9MANJUNATH BS, MA M Y. Texture Feature for Image Retrieval[M]. John Wiley & Sons Inc., 2002.
10MANJUNATH BS, MA M Y. Texture Feature for Browsing and Retrieval of Image Data[J]. IEEE-PAMI, 2000, 18 (8):837- 842.

共引文献42

1郑广,秦敏,付冬,吕秀鉴.基于图像识别的客观题阅卷研究[J].仪器仪表学报,2006,27(z1):783-784. 被引量：5
2彭媛,周军.一种基于线条分类的视频文字检测算法[J].电视技术,2009,33(S1):136-138.
3周万珍,郑广,王建霞,付冬.数字图像处理技术在客观题阅卷中的应用[J].数学的实践与认识,2006,36(8):243-247. 被引量：7
4孟丽,徐法升,李金屏.基于直方图差分的视频分类方法[J].济南大学学报（自然科学版）,2007,21(2):100-103. 被引量：4
5冯国光,齐影虹,肖扬波.基于内容的图像检索技术综述[J].科技广场,2007(3):233-236. 被引量：5
6付慧,刘峡壁,贾云得.基于最大-最小相似度学习方法的文本提取[J].软件学报,2008,19(3):621-629. 被引量：1
7江延湖,白似雪.复杂背景图像文本信息提取技术研究[J].江西教育学院学报,2008(3):18-21.
8蒋瀚洋,郑光勇,范双南.基于媒体特征的多媒体信息检索技术的研究[J].福建电脑,2008,24(8):24-24.
9许锐.基于反馈的综合多特征图像检索技术研究[J].青岛大学学报（工程技术版）,2008,23(2):27-31.
10田其冲,董恒强,何新求.静态图像提取文字技术[J].电脑编程技巧与维护,2008(9):96-97. 被引量：1

同被引文献96

1彭惠,王永瑞.C2C电子商务市场整体卖家信用分布研究[J].情报杂志,2012,31(5):122-127. 被引量：21
2宋国峰,梁昌勇.一种基于用户行为信任的云安全访问控制模型[J].中国管理科学,2013,21(S2):669-676. 被引量：16
3杜利民,侯自强.汉语语音识别研究面临的一些科学问题[J].电子学报,1995,23(10):110-116. 被引量：21
4陈方,高升.语音识别技术及发展[J].电信科学,1996,12(10):54-57. 被引量：26
5李国平,路长厚,李健美,李学勇.阴影莫尔法中光栅传感器的研究[J].传感技术学报,2007,20(3):550-553. 被引量：1
6李学勇,路长厚,李建美.融合轮廓矩和Fourier描述子特征的压印字符识别[J].光电子．激光,2007,18(10):1244-1247. 被引量：7
7李建美,路长厚,李国平.基于Gabor变换的凹凸字符图像特征抽取新方法[J].系统仿真学报,2008,20(8):2133-2136. 被引量：5
8宋砚,刘安安,张勇东,林守勋.基于聚类的视频字幕提取方法[J].通信学报,2009,30(2):136-140. 被引量：10
9沈超,蔡忠闽,管晓宏,房超,杜友田.基于鼠标行为特征的用户身份认证与监控[J].通信学报,2010,31(7):68-75. 被引量：16
10刘加.汉语大词汇量连续语音识别系统研究进展[J].电子学报,2000,28(1):85-91. 被引量：50

引证文献11

1王卫兵,徐倩,韩再博.基于最优质量传输光流法和神经网络的火焰和烟雾检测[J].哈尔滨理工大学学报,2017,22(1):86-90. 被引量：4
2许鸿奎,邵星,韩晓,宫淑兰,王兆斌.基于堆栈自编码的刻划字符检测研究[J].山东建筑大学学报,2018,33(5):24-30.
3杨敏.基于文本识别的图书智能管理[J].自动化技术与应用,2018,37(12):145-150. 被引量：1
4江春.基于改进深度学习算法的区域实时定位方法研究[J].中国电子科学研究院学报,2019,14(6):599-604. 被引量：1
5曲媛媛,宫莉莹,贺维.一种RNN-DBN的网络购物风险评估方法[J].哈尔滨理工大学学报,2019,24(4):105-109. 被引量：3
6许洪军,张洪,贺维.一种基于鼠标行为的云用户异常检测方法[J].哈尔滨理工大学学报,2019,24(4):127-132. 被引量：6
7张春祥,李海瑞,高雪瑶.一种受限玻尔兹曼机的词义消歧方法[J].哈尔滨理工大学学报,2019,24(5):116-121. 被引量：2
8张春祥,周雪松,高雪瑶.一种循环神经网络的词义消歧方法[J].哈尔滨理工大学学报,2020,25(1):80-85. 被引量：1
9唐永军.基于深度学习的智能语音助手研究[J].现代信息科技,2021,5(12):75-79. 被引量：2
10李雅静,丁海洋.基于MSER视频字幕敏感词过滤算法[J].现代信息科技,2023,7(21):80-84.

二级引证文献20

1马明兵,黄婧.基于光流法的篮球图像运动块差异自主检测方法[J].科学技术与工程,2019,19(11):224-229. 被引量：10
2夏雪,袁非牛,章琳,杨龙箴,史劲亭.从传统到深度:视觉烟雾识别、检测与分割[J].中国图象图形学报,2019,24(10):1627-1647. 被引量：17
3李变秀,张以航.图像识别技术在图书馆管理中的应用[J].成长,2019,0(12):8-9.
4尹隽,彭艳红,陆怡,葛世伦,刘鹏.基于深度神经网络的企业信息系统用户异常行为预测[J].管理科学,2020,33(1):30-45. 被引量：13
5芦金雨,费丹雄,范正权,耿晶晶,袁娜娜.光伏发电大数据远程传输质量实时监测研究[J].电子设计工程,2020,28(17):103-107. 被引量：2
6施永军,高祥斌.云环境下异常波动状态协作检测方法研究[J].计算机仿真,2020,37(9):390-394. 被引量：1
7吕娜.基于RNN编码器的交互式平台控制技术开发[J].粘接,2020,44(10):162-164.
8王洪鹏,李伟,李培林,邱泸谊.轻量级的网络流量分类算法[J].中国电子科学研究院学报,2021,16(3):297-303. 被引量：1
9谷丽霞,刘欣芃.基于深度学习的医疗数据智能分析与识别系统设计[J].电子设计工程,2021,29(10):46-50. 被引量：5
10马杰.云际环境下基于用户行为的软件安全研究[J].河南科技,2021,40(8):7-9.

1肖海俊,葛广英,姚坤,尹红敏.基于HALCON的喷码字符识别技术的研究与实现[J].现代电子技术,2015,38(15):95-98. 被引量：16
2陈其昌,郝春雨.针式打印机大型字符库的设计[J].电子计算机外部设备,1993,17(4):24-27.
3陈鹏,张英争.基于DSP+FPGA的视频处理分析系统[J].信息通信,2016,29(2):242-243.
4张燕姑.多媒体技术的原理与应用[J].温州师范学院学报,1997,18(3):39-41.
5张伟.监控领域视频发展轨迹[J].A&S（安防工程商）,2006(B10):167-171.
6胡艳军,李晓辉.基于Video for Windows的多煤体视频信息处理及其开发应用[J].微小型计算机开发与应用,1998(1):31-34. 被引量：1
7李利杰.一种改进的运动目标检测算法研究与实现[J].中小企业管理与科技,2012(27):286-287. 被引量：1
8路玉峰,王增才,刘学忠.提高PCA识别率的新算法[J].光学技术,2008,34(1):10-13. 被引量：3
9王红建.X－Window系统环境下汉字的使用方法[J].航空计算技术,1995,25(3):44-47.
10费梦圆,闯跃龙,郭文平.基于Android的图像文本区域检测[J].信息技术,2016,40(6):103-106. 被引量：1

哈尔滨理工大学学报

2016年第6期

浏览历史

内容加载中请稍等...

基于深度学习法的视频文本区域定位与识别被引量：11

参考文献5

二级参考文献43

共引文献42

同被引文献96

引证文献11

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于深度学习法的视频文本区域定位与识别 被引量：11

参考文献5

二级参考文献43

共引文献42

同被引文献96

引证文献11

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于深度学习法的视频文本区域定位与识别被引量：11