基于多模态数据融合的短视频分类研究

下载PDF

导出

摘要文章通过对短视频领域真实场景多模态的数据进行分析研究,对短视频中的标题、音频转文本识别结果以及视频OCR识别结果采用多种不同的拼接方式并展开消融实验。同时,对基线模型进行改进,将文本特征和视频特征分别在权重共享的Embedding和非权重共享的Embedding上将合并的文本模态特征和视频模态特征一起传入BERT网络实现Early-Fusion。实验结果表明,改进的算法有效地提升了分类精度。

作者陈小娥陈德涛

机构地区福建船政交通职业学院信息与智慧交通学院

出处《电脑知识与技术》 2023年第25期106-108,共3页 Computer Knowledge and Technology

基金福建省教育厅中青年教师科研项目(科技)(编号:JAT210704)(项目名称:基于多模态数据融合的行人重识别研究)。

关键词多模态短视频分类 Early-Fusion BERT

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1曾祥玖,刘达维,刘逸凡,赵志滨,柳秀梅,任酉贵.融合多模态特征的新闻短视频分类模型[J].计算机工程与应用,2023,59(14):107-113. 被引量：2

共引文献1

1孙宇茹.基于多文本图像的虚假新闻多模态检测模型研究[J].微型电脑应用,2024,40(7):242-244.

1陈育民.慢直播系统组成及应用[J].电视技术,2023,47(8):187-189. 被引量：1
2芝麻蜂蜜粥治便秘[J].老同志之友（上半月）,2023(9):70-70.
3成霄翔,宋宝宇.基于改进YOLOv3的缺陷检测算法研究[J].鞍钢技术,2023(5):29-34.
4滋阴养血药膳两款[J].饮食科学,2023(9):34-34.
5缓解神疲乏力药膳两款[J].饮食科学,2023(8):34-34.
6马斌,张亚.针对电动车头盔佩戴的YOLOv5s改进算法研究[J].无线互联科技,2023,20(15):90-93. 被引量：1
7张少林,姜吴瑾,李太福,杨杰.改进YOLOX-s算法的自动贩卖机商品检测方法[J].计算机工程与应用,2023,59(20):274-282. 被引量：1
8张振华.基于短视频的传统文化现代传播模式创新探索[J].东西南北,2023(9):123-125.
9武香俊.光明日报微信视频号:让主旋律、正能量成为网络大流量[J].传媒,2023(19):51-53. 被引量：2
10杨双,张荣芬,刘宇红,刘源,程娜娜,刘昕斐.面向盲人避障的单目深度估计方法[J].建模与仿真,2023,12(5):4642-4653.

电脑知识与技术

2023年第25期

浏览历史

内容加载中请稍等...

基于多模态数据融合的短视频分类研究

参考文献1

共引文献1

相关作者

相关机构

相关主题

浏览历史