基于特征点的电影字幕提取

Movie Subtitle Extraction Based on Feature Points

下载PDF

导出

摘要电影字幕作为电影图像的解释文本,可以帮助观众更好地理解电影剧情.针对在复杂背景下提取字幕困难的问题,提出基于特征点、颜色等多特征融合的电影中英文字幕同时提取算法.该算法首先通过帧间差分算法进行运动目标检测,提取电影图像中的字幕帧;然后通过运用ORB特征点检测技术、启发式筛选、形态学处理等方法定位字幕,对准确定位的文本区域通过颜色聚类提取字幕文本,实现文本分割;最后通过OCR文字识别技术实现对字幕帧文本的识别.实验结果表明:该方法将处理帧数减少到与字幕条数相同,将字幕提取的准确率提高到95%,提高了字幕检测效率,验证了多特征融合技术的有效性. As the explanatory text of movie images,movie subtitle can help audiences to better understand the plot of a movie.To address the difficulty of extracting subtitles in complex backgrounds,a simultaneous extraction algorithm for Chinese and English subtitles in movies is proposed based on the fusion of multiple features such as feature points and colors.In this algorithm,the moving target is detected by inter-frame difference algorithm,and the subtitle frame in the movie image is extracted.Then,by using ORB feature point detection technology,heuristic filtering,morphological processing,and other methods to locate subtitles,color clustering is used to extract subtitle text from the accurately located text area,achieving text segmentation.Finally,OCR text recognition technology is used to recognize the subtitle frame text.The experimental results show that this method reduces the number of frames processed to the same as the number of caption bars,the accuracy of subtitle extraction was improved to 95%,improves the efficiency of subtitle detection,and verifies the effectiveness of multi-feature fusion technology.

作者路鑫杨硕 LU Xin;YANG Shuo(Shenyang University of Chemical Technology,Shenyang 110142,China)

机构地区沈阳化工大学计算机科学与技术学院

出处《沈阳化工大学学报》 CAS 2023年第2期178-185,共8页 Journal of Shenyang University of Chemical Technology

基金辽宁省教育厅科学研究项目(LQ2017008)。

关键词字幕定位文本提取颜色聚类多特征融合 subtitle positioning text extraction color clustering multifeature fusion

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1尹芳,郑亮,陈田田.基于Adaboost算法的场景中文文本定位[J].计算机工程与应用,2017,53(4):200-204. 被引量：6
2乔平安,刘佩龙.基于SWT法网络社交平台图像文本检测[J].现代电子技术,2019,42(20):48-52. 被引量：1
3张进,王贵成,汪滢.基于模糊聚类的谷氨酸发酵过程故障诊断研究[J].沈阳化工大学学报,2017,31(2):182-187. 被引量：5
4曹鲁慧,邓玉香,陈通,李钊.一种基于深度学习的中文文本特征提取与分类方法[J].山东科学,2019,32(6):106-111. 被引量：4
5孙增友,段玉帅,李亚.基于中心环绕滤波器检测的图像特征点匹配算法[J].计算机应用,2017,37(12):3547-3553. 被引量：9
6杨硕,张波,张志杰.多特征融合的车牌定位算法[J].计算机应用,2016,36(6):1730-1734. 被引量：16

二级参考文献31

1王清,潘宏侠,周传刚.机械故障诊断技术现状及趋势[J].机械管理开发,2005,20(6):49-51. 被引量：20
2阳琳贇,王文渊.聚类融合方法综述[J].计算机应用研究,2005,22(12):8-10. 被引量：28
3李闯,丁晓青,吴佑寿.一种基于直方图特征和AdaBoost的图像中的文字定位算法[J].中国图象图形学报,2006,11(3):325-331. 被引量：16
4付光远.一种基于Sobel分解算子的图像边缘检测并行算法[J].微电子学与计算机,2006,23(9):132-134. 被引量：18
5孙红星,赵楠楠,徐心和.基于小波变换和SVM的文本区域定位[J].东北大学学报（自然科学版）,2007,28(2):165-168. 被引量：7
6李刚,曾锐利,林凌,王蒙军.基于数学形态学的车牌定位算法[J].仪器仪表学报,2007,28(7):1323-1327. 被引量：67
7曾丽华,李超,熊璋.基于边缘与颜色信息的车牌精确定位算法[J].北京航空航天大学学报,2007,33(9):1112-1116. 被引量：21
8陈琳,何嘉.基于模糊聚类的粒子群优化算法[J].西南民族大学学报（自然科学版）,2007,33(4):739-742. 被引量：5
9ANAGNOSTOPOU1,OS C-N E, ANAGNOSTOPOULOS I E, PSO- ROULAS I D, et al. License plate recognition from still images and video sequences: a survey [ J]. IEEE Transactions on Intelligent Transportation Systems, 2008, 9(3): 377-391.
10YU S-F, XU Z-J, ZHANG B B, et al. A novel algorithm for license plate location based on the RGB tatures and the texture features[ C] //Proceedings of the 2012 5th International Conference on Bio- medical Engineering and lnformatics. Piscataway, N J: IEEE, 2012: 156- 159.

共引文献35

1王晓群,刘宏志.基于自适应数学形态学的车牌定位研究[J].图学学报,2017,38(6):843-850. 被引量：15
2刘晴辉,徐巍,董红召.基于抓拍数据时空判别的车牌检错纠错研究[J].机电工程,2018,35(1):101-105.
3韦玉科,欧阳发.基于相邻像素差异值的车牌定位算法[J].计算机工程与设计,2018,39(5):1387-1392. 被引量：4
4杨硕,周霜菊,张志杰.基于水平点-段特征的车牌定位算法[J].计算机工程与设计,2018,39(8):2570-2575. 被引量：3
5李心蕾,王昊,刘小敏,邓三鸿.面向微博短文本分类的文本向量化方法比较研究[J].数据分析与知识发现,2018,2(8):41-50. 被引量：14
6郭海富,帅鹏举,王霞.基于颜色和边缘信息的车牌定位方法研究[J].科技视界,2018(5):198-199. 被引量：2
7魏亭,邱实,李晨,王锐.计算机多尺度辅助定位车牌算法[J].电子学报,2018,46(9):2188-2193. 被引量：7
8罗山.一种基于形态学与区域分析的车牌定位方法[J].山西电子技术,2018(6):11-14. 被引量：4
9罗山.基于数学形态学与投影法的车牌定位[J].攀枝花学院学报,2019,36(2):72-75. 被引量：2
10路雪,刘坤,程永翔.一种深度学习的非机动车辆目标检测算法[J].计算机工程与应用,2019,55(8):182-188. 被引量：14

1刘乐.单机单转包商调度与外包联合优化问题的改进启发式算法[J].运筹与管理,2017,26(11):49-58. 被引量：1
2翟清永,芦凯欣,赵慧.释意理论指导下的人文纪录片字幕翻译研究——以《人生第一次》为例[J].英语广场（学术研究）,2023(10):20-23.
3游朕文,何杨.从目的论角度探析电影字幕的翻译——以电影《唐顿庄园》为例[J].英语广场（学术研究）,2023(26):11-14.
4刘正男,刘春静.基于纹理先验和颜色聚类的图像增强算法[J].红外技术,2023,45(9):932-940. 被引量：1
5张晓.互动电影体验研究——以《如果有当初》为例[J].现代电影技术,2023(3):40-46. 被引量：1
6刘媛,应小寒.生态翻译学视域下爱国主义电影字幕英译研究——以《长津湖》为例[J].长春大学学报,2023,33(9):65-70. 被引量：1
7刘海波,郭乃宏,周锋,高尚尚,王如刚.基于FPGA的改进四帧差分的运动目标检测算法[J].电子器件,2023,46(4):1089-1095. 被引量：2
8谢浚.论电影配乐中电子音乐的音色结构力[J].大众文艺（学术版）,2023(10):57-59.
9马学红,彭建武.关联理论视角下纪录片字幕翻译——以《走进大凉山》为例[J].英语广场（学术研究）,2023(25):11-14.
10李洁.《人生大事》电影海报的多模态语篇分析[J].海外英语,2023(12):76-78.

沈阳化工大学学报

2023年第2期

浏览历史

内容加载中请稍等...

基于特征点的电影字幕提取

参考文献6

二级参考文献31

共引文献35

相关作者

相关机构

相关主题

浏览历史