基于多模态特征融合的新闻故事单元分割被引量：8

News Story Unit Segmentation Based on Multi-modal Feature Fusion

下载PDF

导出

摘要对新闻视频进行结构分析,提出一种基于多模态特征融合的新闻故事单元分割方法。将新闻视频分割成音频流和视频流,选择静音区间为音频候选点,将镜头边界切变点作为视频候选点,做主持人镜头和主题字幕的探测,挑选主持人镜头为候选区间,并记录主题字幕的起始位置和结束位置,利用时间轴融合音频候选点、视频候选点、主持人镜头和主题字幕,对新闻视频进行故事单元分割。实验结果表明,该方法的查全率为83.18%,查准率为83.92%。 News story unit segmentation method based on multi-modal feature fusion is proposed in this paper by analyzing news video structure.News video is divided into audio stream and video stream.Mute intervals are detected as audio candidate points,and the shot segmentations for news video are detected and shot boundary points are chosen as video candidate points,anchorperson shot and topic caption are detected.Story units are detected by fusing audio candidate points,video candidate points,anchorperson shot and topic caption based on time axis.Experimental results show that this method can get 83.18% in recall and 83.92% in precision.

作者刘嘉琦封化民闫建鹏

机构地区西安电子科技大学通信工程学院北京电子科技学院

出处《计算机工程》 CAS CSCD 2012年第24期161-165,共5页 Computer Engineering

基金国家自然科学基金资助项目(60972139) 北京市自然科学基金资助项目(4092041)

关键词新闻视频多模态特征字幕音频故事单元分割 news video multi-modal feature caption audio story unit segmentation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1严明,苏新宁.数字视频信息的索引研究[J].现代图书情报技术,2005(7):46-50. 被引量：6
2冀中,张春田,苏育挺.新闻视频故事单元分割技术综述[J].中国图象图形学报,2007,12(11):1952-1960. 被引量：9
3Danna L, Percannella G, Sansone C. A Multi-stage Approach for News Video Segmentation Based on Automatic Anchorperson Number Detection[C]//Proc. of International Conference on Mobile Ubiquitous Computing, Systems, Services and Technologies. [S. 1.]: IEEE Press, 2007.
4Wang Jia-Ching, Wang Jhing-Fa, Lin Caibei, et al. Content-based Audio Classification Using Support Vector Machines and Independent Component Analysis[C]//Proc. of the 18th International Conference on PatternRecognition. Washington D. C., USA: IEEE Computer Society, 2003.
5方卫,刘森,封化民,等.一种新的视频分割和关键帧提取统一框架[C]//第三届全国搜索引擎和网上信息挖掘学术研讨会论文集.北京:[出版者不详],2005.
6赵亚琴.一种有效的新闻视频主题字幕检测方法[J].计算机工程与应用,2009,45(33):175-178. 被引量：5
7赵黎.基于OpenCV的人脸检测系统设计与实现.科技信息,2008,(18):351-351.
8梁学战,朱明.融合多特征的新闻故事自动分割[J].计算机应用,2009,29(4):959-961. 被引量：2
9刘华咏.基于音视频特征和文字信息自动分段新闻故事[J].系统仿真学报,2004,16(11):2608-2610. 被引量：8

二级参考文献64

1严明,秦嘉杭.基于文本信息的数字视频检索研究[J].情报科学,2004,22(7):865-869. 被引量：10
2苏新宁.视频信息索引技术研究进展[J].情报学报,2004,23(4):410-416. 被引量：7
3严明,苏新宁.数字视频信息的元数据研究[J].情报学报,2004,23(5):605-610. 被引量：8
4刘华咏.基于音视频特征和文字信息自动分段新闻故事[J].系统仿真学报,2004,16(11):2608-2610. 被引量：8
5王策,何炎祥,王云,张春林.基于视音频特征和文本信息的新闻视频自动场景分割[J].计算机工程,2005,31(6):171-172. 被引量：1
6D'ANNA L, PERCANNELLA G, SANSONE C, et al. A multi-stage approach for news video segmentation based on automatic anchorperson number detection [ C]// Proceedings of the 2007 International Conference on Mobile Ubiquitous Computing, Systems, Services and Technologies. Washington, D C: IEEE Computer Society, 2007: 229 - 234.
7de SANTO M, PERCANNELLA G, SANSONE C, et al. Segmentation of news videos based on audio-video information[ J]. Pattern Analysis and Applications, 2007, 10(2): 135 -145.
8XU XIN-WEN, LI GUO-HUI, YUAN JIAN. A segmentation method of news video stories based on announcer's voiceprint[ C]//Proceedings of the 7th International Conference on Machine Learning and Cybernetics. Kunming, China: IEEE, 2008:2749-2753.
9卿来云,王伟强,高文.文字自动提取及其在视频索引和检索中的应用[C]//中科院第7届计算机研究生科技论坛,2002:1-9.
10Tang X O,Gao X B,Liu J Z,et al.A spatial-temporal approach for video caption detection and recognition[J].IEEE Transactions on Neural Networks,2002,13(4) :961-971.

共引文献28

1李冬秀.视频元数据及其互操作研究[J].现代情报,2006,26(1):92-94. 被引量：3
2徐武,李琳,陶红亮,杨印根.Web Information Retrieval的分析与展望[J].景德镇高专学报,2006,21(4):15-17. 被引量：1
3孟丽,徐法升,李金屏.基于直方图差分的视频分类方法[J].济南大学学报（自然科学版）,2007,21(2):100-103. 被引量：4
4文军,曾璞,徐建军,栾悉道,吴玲达.多模态特征融合的新闻视频故事分割方法[J].小型微型计算机系统,2008,29(1):171-174. 被引量：1
5阮海红.数字媒体知识管理研究[J].现代情报,2008,28(1):152-154. 被引量：1
6谢小梅.基于“需求——价值论”视频资源的采访[J].图书馆工作与研究,2008(4):30-31. 被引量：1
7冀中,苏育挺,宋星光,纪旭,华蕊.基于上下文信息的新闻故事单元分割[J].天津大学学报,2009,42(2):153-158. 被引量：2
8梁学战,朱明.融合多特征的新闻故事自动分割[J].计算机应用,2009,29(4):959-961. 被引量：2
9冀中,苏育挺,宋星光,安欣.面向新闻视频内容分析的音频分层分类算法[J].计算机应用研究,2009,26(5):1673-1675. 被引量：1
10储泽楠,闫琰.肤色模型的面部肤色区域提取[J].电脑编程技巧与维护,2009(18):94-95. 被引量：1

同被引文献57

1钱刚,曾贵华.典型视频镜头分割方法的比较[J].计算机工程与应用,2004,40(32):51-55. 被引量：29
2王璐,周英杰,徐正全.基于梯度向量角法的视频序列中镜头渐变检测[J].计算技术与自动化,2004,23(4):61-62. 被引量：2
3李宏贵,李兴国.一种新的基于小波变换的边缘检测方法[J].计算机应用与软件,2005,22(3):103-104. 被引量：6
4孟丽,徐法升,李金屏.基于直方图差分的视频分类方法[J].济南大学学报（自然科学版）,2007,21(2):100-103. 被引量：4
5刘俊晓,孟祥增,刘旭花,吴鹏飞.基于帧差与非相邻帧差的自适应镜头检测方法[J].计算机工程与应用,2007,43(24):212-215. 被引量：8
6刘典,刘文萍.一种基于直方图的切变镜头自动检测算法[J].北方工业大学学报,2007,19(3):16-20. 被引量：7
7Danna L, Percannella G, Sansone C. A multi-stage approach for news video segmentation based on automatic anchorperson num- ber detection[C]//Proc, of International Conference on MobileUbiquitous Computing, Systems, Services and Technologies. [S. 1. ]:IEEE Press, 2007.
8Sugano M,Furuya M, Nakaiima Y, etal. Shot classifaetion and scene segmentation based on MPEG compressed movie analysis [J]. Lecture Notes in Computer Science, 2005, 3331:271-279.
9韩冰,高新波,姬红兵.基于粗糙集和模糊聚类的新闻视频镜头边界检测方法[J].中国图象图形学报,2007,12(3):522-528. 被引量：8
10冀中,张春田,苏育挺.新闻视频故事单元分割技术综述[J].中国图象图形学报,2007,12(11):1952-1960. 被引量：9

引证文献8

1姜静,张栋梁.基于镜头内容的视频检索系统[J].山东理工大学学报（自然科学版）,2013,27(3):21-24. 被引量：1
2杨亭,丰洪才,金凯,赵杰雪.基于多模态融合和竞争力的视频场景分割算法[J].武汉理工大学学报（信息与管理工程版）,2014,36(6):759-763. 被引量：1
3赵杰雪,丰洪才,杨琳.基于遗传算法的多模态视频场景分割算法[J].武汉理工大学学报（信息与管理工程版）,2015,37(6):841-845. 被引量：4
4张赟,王李冬,沈兵虎,练益群.多特征融合的新闻视频单元高效分割方法研究[J].电视技术,2016,40(11):132-136. 被引量：1
5蔡轶珩,胡朝阳,崔益泽.融合颜色信息与特征点的镜头边界检测算法[J].计算机应用,2017,37(A02):95-98. 被引量：6
6李昊,朱倩梅,曹倩倩.在线新闻视频切变检测技术[J].电脑与信息技术,2017,25(3):26-28.
7李强军,李启南.基于互信息量和自回归模型的镜头分割方法[J].计算机技术与发展,2019,29(1):35-39.
8吴培,周激流.基于多模态相似融合的新闻视频故事分割算法[J].智能计算机与应用,2024,14(1):70-75.

二级引证文献13

1赵杰雪,丰洪才,杨琳.基于遗传算法的多模态视频场景分割算法[J].武汉理工大学学报（信息与管理工程版）,2015,37(6):841-845. 被引量：4
2蓝章礼,帅丹,李益才.基于相关系数的道路监控视频关键帧提取算法[J].重庆交通大学学报（自然科学版）,2016,35(1):129-133. 被引量：6
3程瑞,雷璟,程静.基于条件Shannon熵和VPRS的网络攻击策略评价方法[J].武汉理工大学学报（信息与管理工程版）,2017,39(2):162-167. 被引量：3
4梁平,刘明周.一种多染色体交叉的小生境遗传算法[J].计算机工程与应用,2016,52(18):162-166. 被引量：1
5邓海生.视频特征下的电视广告单元分割技术研究[J].电视技术,2018,42(12):75-78.
6王涛,田丰.一种针对经纬图全景视频的突变镜头边界检测方法[J].工业控制计算机,2019,32(8):149-151. 被引量：1
7王金鹤,衣家欣,孟凡云.基于分层算法立体图像匹配[J].计算机仿真,2019,36(12):224-227. 被引量：1
8李秋玲,赵磊,邵宝民,王雷,姜雪.基于融合特征的自适应阈值镜头边界检测算法[J].计算机工程与设计,2020,41(3):777-782.
9姜燕宁,郝书池.云服务模式下基于集合覆盖的库存-选址模型[J].武汉理工大学学报（信息与管理工程版）,2020,42(5):414-419. 被引量：2
10陈绣瑶.基于融合特征的网络不良视频识别方法研究[J].计算机时代,2020(11):19-22. 被引量：1

1冀中,苏育挺,宋星光,纪旭,华蕊.基于上下文信息的新闻故事单元分割[J].天津大学学报,2009,42(2):153-158. 被引量：2
2冀中,张春田,苏育挺.新闻视频故事单元分割技术综述[J].中国图象图形学报,2007,12(11):1952-1960. 被引量：9
3屈洁,封化民.新闻视频播音员的检测与跟踪[J].北京电子科技学院学报,2009,17(4):1-9. 被引量：1
4徐骏,张炯,周洞汝.基于COM技术的新闻视频主持人镜头实时检测方法[J].计算机应用,2002,22(5):27-30. 被引量：6
5杨兴华,封化民,江超,陈春萍.一种基于多模态特征融合的垃圾邮件过滤方法[J].北京电子科技学院学报,2011,19(2):46-57. 被引量：2
6张广鹏,王蕴红,张兆翔.基于多模态人脸与人耳融合的身份识别与认证[J].高技术通讯,2011,21(7):707-713.
7蒋呈明,蒋兴浩,孙锬锋.基于多特征的视频内容安全过滤方法[J].信息安全与通信保密,2012,10(3):76-77. 被引量：2
8江晟.基于多模态特征的光-SAR图像融合配准算法[J].吉林大学学报（信息科学版）,2015,33(2):208-213. 被引量：5
9王鹏,蔡锐,杨士强.“文本为主”的多模态特征融合的新闻视频分类算法[J].清华大学学报（自然科学版）,2005,45(4):475-478. 被引量：11
10徐新文,李国辉,甘亚莉.基于播音员识别的新闻视频故事分割方法[J].计算机工程与应用,2008,44(19):4-7. 被引量：4

计算机工程

2012年第24期

浏览历史

内容加载中请稍等...

基于多模态特征融合的新闻故事单元分割被引量：8

参考文献9

二级参考文献64

共引文献28

同被引文献57

引证文献8

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于多模态特征融合的新闻故事单元分割 被引量：8

参考文献9

二级参考文献64

共引文献28

同被引文献57

引证文献8

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于多模态特征融合的新闻故事单元分割被引量：8