期刊文献+

基于多模态特征融合的高效性语义视频检索系统

下载PDF
导出
摘要 本文以“视听海南”APP为例,提出了一种基于多模态特征融合的高效性语义视频检索系统。该系统采用无监督的DBSCAN聚类分析,从高维度视频帧内容编码中筛选关键帧,并引入注意力机制和掩体动作来识别预训练网络组成的并行编码器,捕捉图像的局部空间和动作信息,利用对抗生成网络和三元组损失函数优化不同模态特征的对齐,实现高效且准确的视频检索服务。
作者 庄海
出处 《广播电视信息》 2024年第8期16-18,共3页 Radio & Television Information
  • 相关文献

二级参考文献5

共引文献138

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部