基于多模态子空间相关性传递的视频语义挖掘被引量：12

Video Semantics Mining Using Multi-Modality Subspace Correlation Propagation

下载PDF

导出

摘要在视频语义信息理解和挖掘中,充分利用图像、音频和文本等多模态媒质之间的交互关联是非常重要的研究方向.考虑到视频的多模态和时序关联共生特性,提出了一种基于多模态子空间相关性传递的语义概念检测方法来挖掘视频的语义信息.该方法对所提取视频镜头的多模态底层特征,根据共生数据嵌入(co-occurrence data embedding)和相似度融合(Si mFusion)进行多模态子空间相关性传递而得到镜头之间的相似度关系,接着通过局部不变投影(locality preserving projections)对原始数据进行降维以获得低维语义空间内的坐标,再利用标注信息训练分类模型,从而可对训练集外的测试数据进行语义概念检测,实现视频语义信息挖掘.实验表明该方法有较高的准确率. Research on content-based multimedia retrieval is motivated by a growing amount of digital multimedia content in which video data is a big part. Interaction and integration of multi-modality media types such as visual, audio and textual data in video are the essence of video content analysis. Although any uni-modality type partially expresses limited semantics less or more, video semantics are fully manifested only by interaction and integration of any unimodal. Video data comprises plentiful semantics, such as people, scene, object, event and story, etc. A great deal of research has been focused on utilizing multi-modality features for better understanding of video semantics. Proposed in this paper is a new approach to detect semantic concepts in video using co-occurrence data embedding （CODE）, SimFusion, and locality preserving projections （LPP） from temporal associated cooccurring multimodal media data in video. The authors＇ experiments show that by employing these key techniques, the performance of video semantic concept detection can be improved and better video semantics mining results can be obtained.

作者刘亚楠吴飞庄越挺

机构地区浙江大学计算机科学与技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2009年第1期1-8,共8页 Journal of Computer Research and Development

基金国家自然科学基金项目(60603096 60533090) 国家"八六三"高技术研究发展计划重点基金项目(2006AA010107) 长江学者和创新团队发展计划基金项目(IRT0652)~~

关键词视频语义挖掘多模态语义概念检测子空间相关性传递时序关联共生特性 video semantics mining multi-modality propagation temporal associated co-occurrence semantic concept detection subspace correlation

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献23

1中国国家统计局2004年统计数据[OL].[2005-02-15].http://www.stats.gov.cn/tjsj/ndsj/2005/indexch.htm.
2Peter Lyman, Varian Hal R. How much information [OL]. [2007-01-03]. http://www. sims. berkeley. edu/how muchinfo-2003
3Liu Y N, Wu F. Video semantic concept detection using multi modality subspace correlation propagation [C]//Proc of the I3th Int Multimedia Modeling Conference. Berlin: Springer, 2007:527-534
4Babaguchi N, Kawai Y, Kitahashi T. Event based indexing of broadcast sports video by intermodal collaboration [J]. IEEE Trans on Multimedia, 2002, 4(1): 68-75
5Snoek C G M, Worring M. Multimedia event-based video indexing using time intervals [J]. IEEE Trans on Multimedia, 2005, 7(4): 638-647
6代科学,付畅俭,武德峰,李国辉.视频挖掘:概念、技术与应用[J].计算机应用研究,2006,23(1):1-4. 被引量：8
7Snoek C G M, Worring M, Smeulders A W M. Early versus late fusion in semantic video analysis [C] //Proc of the 13th Annual ACM Int Conf on Multimedia. New York: ACM, 2005 : 399-402
8Hotellin H. The most predictable criterion [J]. Journal of Educational Psychology, 1935, 26:139-142
9张鸿,吴飞,庄越挺.跨媒体相关性推理与检索研究[J].计算机研究与发展,2008,45(5):869-876. 被引量：20
10Zhang H, Zhuang Y T, Wu F. Cross modal correlation learning for clustering on image-audio dataset [C] //Proc of ACM Int Conf on Multimedia. New York: ACM, 2007: 273-276

二级参考文献46

1赵丕锡,王秀坤,李国辉,田宏.视频概要的分类与综合评价方法[J].计算机应用研究,2004,21(11):5-7. 被引量：3
2张静,路红,薛向阳.基于索引结构的高效运动视频检索[J].计算机研究与发展,2006,43(11):1953-1958. 被引量：3
3庄毅,庄越挺,吴飞.Composite Distance Transformation for Indexing and κ-Nearest-Neighbor Searching in High-Dimensional Spaces[J].Journal of Computer Science & Technology,2007,22(2):208-217. 被引量：3
4付畅俭李国辉武德峰.基于直方图高阶差分聚类的视频结构挖掘[C]..宁波:第十三届全国多媒体技术学术会议[C].,2004.12-15.
5李国辉武德峰付畅俭.多媒体知识及其获取[C]..宁波:第十三届全国多媒体技术学术会议[C].,2004.451-456.
6A Hampapur, L Brown, J Connell, et al. Smart Surveillance: Applications Technologies and Implications [ C ]. Singapore: IEEE Pacific-Rim Conference on Multimedia, 2003.
7Aslandogan Y, Yu C. Techniques and Systems for Image and Video Retrieval [J]. IEEE Transactions on Knowledge and Data Engineering, 1999,11(1):56-63.
8柳崎峰楼建光.智能视觉监控技术[EB／OL].http://www.seiencetimes.net/snw/2002—23/snw28.htm,2004—12—24.
9Jiawei Han, Micheline Kambr. Data Mining: Concepts and Techniques[M]. Morgan Kaufmann Publishers,2002.
10Mitsuru Kakimoto, Chie Morita, Hiroshi Tsukimoto. Data Mining from Brain Images[J]. Bosteon:ACM SIGKDD Conference, 2000.

共引文献26

1代科学,李国辉,武德峰.聚类挖掘在监控视频中的应用[J].测控技术,2006,25(10):16-18. 被引量：3
2杨西平,宁亚宁.视频结构挖掘的一种改进算法[J].医学信息（西安上半月）,2007,20(11):1901-1904. 被引量：2
3辛国娟,杜秀华.视频数据的时间序列挖掘方法研究[J].计算机仿真,2007,24(11):100-102. 被引量：1
4高清芬.一种监控视频分段的方法[J].衡水学院学报,2008,10(4):24-27.
5柳伟,代科学,卢鑫,郭森.监控视频聚簇模式挖掘及其应用[J].数据采集与处理,2008,23(4):459-466. 被引量：1
6冯根尧,张丽彬,张晓霞.媒介融合时代的文化产品创新与传播[J].经济研究导刊,2012(3):258-259. 被引量：6
7赵丕锡,李宏岩,徐国凯.基于事务序列的视频摘要挖掘方法研究[J].计算机工程与应用,2012,48(15):159-163.
8李广丽,张红斌.基于颜色特征相似度判别的肿瘤图像检索研究[J].计算机工程与设计,2012,33(11):4272-4277. 被引量：2
9李广丽,张红斌,移梦阳.数字图书馆中跨媒体检索模型的设计及优化探索[J].情报理论与实践,2013,36(2):104-108. 被引量：5
10宁建红,吴显勰,杨尚衡.跨媒体检索研究[J].福建电脑,2013,29(4):4-6.

同被引文献140

1代科学,张军,李国辉,来旭.监控视频运动目标的频繁轨迹模式挖掘[J].国防科技大学学报,2006,28(6):108-113. 被引量：5
2赵丕锡,王秀坤,李国辉,田宏.视频概要的分类与综合评价方法[J].计算机应用研究,2004,21(11):5-7. 被引量：3
3谢毓湘,栾悉道,吴玲达,老松杨,肖鹏.辅助决策的新闻视频挖掘[J].计算机科学,2004,31(8):136-139. 被引量：4
4徐险峰.基于内容的多媒体信息检索技术[J].现代情报,2005,25(3):134-136. 被引量：5
5代科学,武德峰,付畅俭,李国辉,李惠佳.视频挖掘技术综述[J].中国图象图形学报,2006,11(4):451-457. 被引量：11
6耿玉亮,须德.一种鲁棒的摄像机运动分类算法[J].电子学报,2006,34(7):1342-1346. 被引量：3
7代科学,李国辉,武德峰.聚类挖掘在监控视频中的应用[J].测控技术,2006,25(10):16-18. 被引量：3
8付畅俭,李国辉,代科学.视频结构挖掘的概念及应用[J].计算机应用研究,2007,24(2):20-23. 被引量：6
9Simeon J, Simoff, Osmar R Z. Report on MDM/KDD2000[C]// The 1st International Workshop on Multimedia Data Mining. SIGKDD Explorations,2001,2(2) : 103-105.
10Rasheed Z. Video categorization using semantics and semiotics [C]//Video Mining[A]. Boston: Kluwer Academic Publishers, 2003.

引证文献12

1代科学,李强,李国辉.视频挖掘研究进展[J].计算机科学,2010,37(10):11-15. 被引量：6
2闫建鹏,封化民,刘嘉琦.一种基于多模态特征的新闻视频语义提取框架[J].计算机应用研究,2012,29(7):2725-2729. 被引量：2
3蒋建国,顾占冰,胡珍珍,齐美彬.多摄像机视域内的目标活动分析[J].电子学报,2014,42(2):306-311. 被引量：8
4孙伟强.基于异方差PLDA的外观流形建模视频人脸识别[J].电视技术,2014,38(9):218-222.
5胡峻峰,曹军.基于语义挖掘的室性心动过速及心室纤颤检测[J].计算机工程,2014,40(7):307-311. 被引量：2
6侯燕,李巍,文乔农.基于复杂网络数据流密度的增量子空间数据挖掘算法[J].计算机应用研究,2015,32(7):2023-2026. 被引量：11
7张雪峰,赵莉.视觉单词优化仿射尺度不变特征变换的视频人脸识别[J].计算机应用与软件,2015,32(7):223-227. 被引量：2
8相子喜,吕学强,张凯.基于有向图模型的多模态新闻图像检索研究[J].科学技术与工程,2016,16(3):78-84. 被引量：4
9董永亮,柴旭清.基于潜在语义的双层图像-文本多模态检索语义网络[J].计算机工程,2016,42(7):299-303. 被引量：6
10甘胜江,孙连海,何俊林,卢颖.基于概率图模型的多模态数据联合检索算法[J].现代电子技术,2017,40(5):33-37. 被引量：1

二级引证文献55

1赵丕锡,李宏岩,徐国凯.基于事务序列的视频摘要挖掘方法研究[J].计算机工程与应用,2012,48(15):159-163.
2王轩.数据挖掘热点和研究方向浅析[J].黑龙江科技信息,2012(27):105-105. 被引量：2
3姜振凤,迟庆云.基于DBAN的监控视频数据挖掘[J].河北工程大学学报（自然科学版）,2013,30(2):98-102.
4宋韧,岳进,徐志超,刘洋.关于网络异常信息数据快速提取仿真[J].计算机仿真,2018,35(12):233-236. 被引量：2
5王细萍,黄婷,谭文学,吴华瑞,孙闯.基于卷积网络的苹果病变图像识别方法[J].计算机工程,2015,41(12):293-298. 被引量：13
6田国会,尹建芹,闫云章,李国栋.基于混合高斯模型和主成分分析的轨迹分析行为识别方法[J].电子学报,2016,44(1):143-149. 被引量：15
7钟忺,杨光,卢炎生.基于双阈值滑动窗口子镜头分割和完全连通图的关键帧提取方法[J].计算机科学,2016,43(6):289-293. 被引量：3
8陈烽.数字图像库中彩色图像信息特征检索优化[J].计算机仿真,2016,33(8):430-433. 被引量：5
9宋丹,黄旭.生物识别技术及其在金融支付安全领域的应用[J].信息安全研究,2016,2(1):27-32. 被引量：19
10陈彦明,赵清杰,刘若宇.一种适用于分布式摄像机网络的SCIWCF算法[J].电子学报,2016,44(10):2335-2343. 被引量：6

1金凯,丰洪才,杨亭.基于语义概念的多模态视频场景分割算法[J].小型微型计算机系统,2014,35(9):2156-2161.
2向云柱.基于镜头竞争力的多模态视频场景分割算法[J].计算机与数字工程,2014,42(2):296-299.
3张付志,张启凤.融合多系统用户信息的协同过滤算法[J].计算机工程,2009,35(21):258-260. 被引量：2
4谭璐,易东云,冯国柱,吴翊.局部不变投影[J].自然科学进展,2004,14(3):282-287. 被引量：10
5毕孝儒.项目子相似度融合的协同过滤推荐算法[J].计算机系统应用,2015,24(1):147-150. 被引量：3
6成鹏,汪西莉.基于相似度融合的主动支持向量机算法[J].计算机工程,2011,37(12):166-169. 被引量：2
7李国芳.基于2DPCA和流形学习LPP算法的人脸特征提取应用[J].电脑知识与技术,2014,0(11):7438-7441. 被引量：3
8高赞,赵志诚,蔡安妮,谢晓辉.多层次SIFT特征在语义概念检测中的应用[J].计算机工程与应用,2011,47(2):1-4.
9张建明,李梅,李广翠.基于Simfusion和本体的视频语义提取[J].计算机工程,2011,37(15):212-214.
10于世彩,谢颖华,王巧.协同过滤的相似度融合改进算法[J].计算机系统应用,2017,26(1):135-140. 被引量：6

计算机研究与发展

2009年第1期

浏览历史

内容加载中请稍等...

基于多模态子空间相关性传递的视频语义挖掘被引量：12

参考文献23

二级参考文献46

共引文献26

同被引文献140

引证文献12

二级引证文献55

相关作者

相关机构

相关主题

浏览历史

基于多模态子空间相关性传递的视频语义挖掘 被引量：12

参考文献23

二级参考文献46

共引文献26

同被引文献140

引证文献12

二级引证文献55

相关作者

相关机构

相关主题

浏览历史

基于多模态子空间相关性传递的视频语义挖掘被引量：12