期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于深度多模态特征融合的短视频分类被引量：12

Deep multimodal feature fusion for micro-video classification

下载PDF

导出

摘要目前,短视频已经成为新媒体时代极具有代表性的产物之一,其天然的具有时短、强编辑等特点,使得传统视频分类模型不再适合于短视频分类任务。针对综合短视频分类问题的特点,提出了一种基于深度多模态特征融合的短视频分类算法。所提算法将视觉模态信息和音频模态信息输入到域分离网络中,将整个特征空间划分为所有模态共享的公有域部分及由音频模态和视觉模态分别独有的私有域部分,借助优化域分离网络,最大程度地保留了不同模态特征间的差异性和相似性。在公开的短视频分类数据集上进行实验,证明了所提算法可以有效减少特征融合时的冗余性,并将分类的平均精度提高到0.813。 Nowadays,micro-video has become one of the most representative products in the new media era.It has the characteristics of short time and strong editing,which makes the traditional video classification models no longer suitable for micro-video classification task.Based on the characteristics of the micro-video classification problem,the micro-video classification algorithm based on deep multimodal feature fusion is proposed.The proposed algorithm inputs the visual modal information and acoustic modal information into the domain separation network,and divides the entire feature space into a shared domain part shared by all modalities and the private domain part unique to the acoustic and visual modalities respectively.By optimizing the domain separation network,the differences and similarities among different modal features are preserved to the greatest extent.The experiments on the public micro-video classification dataset prove that the proposed algorithm can effectively reduce the redundancy of feature fusion and improve the average classification accuracy to 0.813.

作者张丽娟崔天舒井佩光苏育挺 ZHANG Lijuan;CUI Tianshu;JING Peiguang;SU Yuting(School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China)

机构地区天津大学电气自动化与信息工程学院

出处《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第3期478-485,共8页 Journal of Beijing University of Aeronautics and Astronautics

基金国家自然科学基金(61802277) 中国博士后科学基金(2019M651038)。

关键词短视频多模态学习深度网络分类特征空间 micro-video multimodal learning deep network classification feature space

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献166

1孟昭兰.体验是情绪的心理实体——个体情绪发展的理论探讨[J].应用心理学,2000,6(2):48-52. 被引量：48
2薛文忠,李蕾.论网络媒体与武术传播[J].广州体育学院学报,2004,24(4):117-119. 被引量：16
3喻国明,李莹,李彪.基于神经科学的传播学研究--工具、路径与研究框架[J].国际新闻界,2008,30(7):40-46. 被引量：6
4陈威,俞大伟.从传播类型的角度审视孙氏太极拳的发展现状[J].北京体育大学学报,2009,32(1):35-38. 被引量：8
5文松山.漫谈标准化原理──“以规矩,成方圆”[J].世界标准化与质量管理,1998(6):37-38. 被引量：4
6刘念,刘孙俊,刘勇,赵辉.一种基于免疫的网络安全态势感知方法[J].计算机科学,2010,37(1):126-129. 被引量：16
7罗跃嘉.情绪与心境障碍的神经基础[J].军事医学,2011,35(9):641-645. 被引量：5
8孙艳,周学广,陈涛.意会关键词信息取证方法[J].计算机工程,2011,37(19):266-269. 被引量：3
9谢丽星,周明,孙茂松.基于层次结构的多策略中文微博情感分析和特征抽取[J].中文信息学报,2012,26(1):73-83. 被引量：199
10陈剑晖.中国文体研究的演变、特征与方法论问题[J].福建论坛（人文社会科学版）,2012(10):89-96. 被引量：2

引证文献12

1陈然,赵晶,郝慧超,王凯伦.基于多模态深度学习的审美认知规律大规模测度方法[J].装饰,2021(7):106-111. 被引量：6
2石磊,马自行,祁子豪,左洪强,刘成明.基于大数据多模融合的智能风险防控系统[J].电子技术与软件工程,2021(21):171-173. 被引量：1
3吴晨思,蔡茂滨,杨耀淳,赵晓莺,范科峰.视频内容安全评价发展探讨[J].中国图象图形学报,2022,27(1):163-175. 被引量：1
4李青霏.浅谈短视频文化在东北地区的流量营销策略[J].中国传媒科技,2022(5):50-51.
5马含,李进明,王竹君,关威.基于双向树多模态融合谣言检测方法的研究[J].菏泽学院学报,2022,44(2):21-25.
6井佩光,李亚鑫,苏育挺.一种多模态特征编码的短视频多标签分类方法[J].西安电子科技大学学报,2022,49(4):109-117. 被引量：5
7彭家辉,张长念,胡乐刚.太极拳短网络视频传播影响因素及模型构建——扎根于短视频用户对太极拳视频的评论[J].湖北体育科技,2022,41(7):604-609. 被引量：3
8刘佳琳,李喆.多模态学习的研究热点、动态前沿与趋势分析--基于CiteSpace软件的可视化分析[J].卫生职业教育,2022,40(19):125-129. 被引量：1
9邸敬存,白贵.短视频分类的学理困境及新分类逻辑建构[J].出版广角,2023(19):59-64.
10王南.基于云计算的短视频媒体资源个性化推送方法[J].兵工自动化,2024,43(2):16-22. 被引量：2

二级引证文献19

1周详,刘子玥,施佳颖.数字足迹支持下的景观视觉感知评价:以秦淮河历史性城市景观为例[J].风景园林,2022,29(9):18-25. 被引量：12
2赵积明,施媚妮.基于深度学习的移动大数据分析算法[J].电子技术与软件工程,2022(21):227-230.
3徐源,张玉杰.基于改进ShuffleNetV2的敏感内容识别与应用[J].传感器与微系统,2023,42(3):164-168. 被引量：2
4陈然,赵晶.基于样式生成对抗网络的风景园林方案生成及设计特征识别[J].风景园林,2023,30(7):12-21. 被引量：12
5孔璐琦,王敬敬,胡琳珍,黄志勇.放线菌代谢产物的研究进展:基于Web of Science(WOS)和中国知网(CNKI)[J].微生物学通报,2023,50(9):4275-4302. 被引量：1
6方艺舒,陈江.具有心理共情能力的电影博物馆产品设计研究[J].包装工程,2023,44(20):282-289. 被引量：2
7李冬梅,杨宇,孟湘皓,张小平,宋潮,赵玉凤.多标签分类综述[J].计算机科学与探索,2023,17(11):2529-2542. 被引量：3
8邓嘉杰,邓罗平.足球网络视频传播影响因素及相关模型构建扎根于短视频用户对足球视频的评论[J].体育科技文献通报,2024,32(1):191-194. 被引量：1
9李华,李国.无人机可见光遥感影像地物目标提取技术研究[J].计算机测量与控制,2024,32(2):250-255. 被引量：1
10王南.基于云计算的短视频媒体资源个性化推送方法[J].兵工自动化,2024,43(2):16-22. 被引量：2

1轻松地带[J].棋艺（象棋）,2008(4):62-62.
2朴志会.互动[J].东方养生,2008(9):155-155.
3税嘉陵.北京市近郊城市森林群营建策略研究——以朝阳区崔各庄、孙河乡地区为例[J].广西城镇建设,2021(4):46-49.
4王定雪,王劲红.基于数据挖掘分析王劲红教授治疗胸痹临床用药特点[J].中国社区医师,2021,37(12):98-100. 被引量：1
5马辉.基于深度特征融合的面部表情智能识别技术[J].科学技术创新,2021(11):78-79.
6左晋佺,张晓娟.基于信息安全的双区块链电子档案管理系统设计与应用[J].档案学研究,2021(2):60-67. 被引量：34
7郭兴林,孙振晓,周昱瑶,漆莲芝,张谊.基于Pignistic概率转换和奇异值分解的证据冲突度量方法[J].通信学报,2021,42(4):150-157. 被引量：4
8蔡嘉奕,梁帆.基于空间体验的空间构形设计策略——以巴塞罗那德国馆方案为例[J].美与时代（城市）,2021(3):86-87. 被引量：1
9徐雁.何物贻谋远,无过万卷书--追忆近代江苏公共图书馆建立初期读者服务工作[J].新世纪图书馆,2021(4):5-12. 被引量：1
10贾杜平,莫丽,毛良杰,曾松.深水隔水管-测试管柱系统涡激振动实验研究[J].工程设计学报,2021,28(2):170-178. 被引量：3

北京航空航天大学学报

2021年第3期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部