-
题名一种多任务学习的跨模态视频情感分析方法
被引量:1
- 1
-
-
作者
缪裕青
董晗
张万桢
周明
蔡国永
杜华巍
-
机构
桂林电子科技大学计算机与信息安全学院
桂林电子科技大学广西图像图形与智能处理重点实验室
桂林航天工业学院工程综合训练中心
仲恺农业工程学院信息科学与技术学院
桂林海威科技股份有限公司
桂林电子科技大学广西可信软件重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第12期141-147,共7页
-
基金
国家自然科学基金(61866007)
广西自然科学基金重点项目(2018GXNSFDA138006)
+3 种基金
广西高校图像图形智能处理重点实验室研究项目(GIIP201706)
广西自然科学基金(2020GXNSFAA159094)
广西高校中青年教师科研基础能力提升项目(2021KY0799)
桂林电子科技大学研究生教育创新计划(2022YCXS066)。
-
文摘
针对现有跨模态视频情感分析模型中模态融合不充分、空间复杂度较高以及较少考虑说话人本身属性对情感影响等问题,提出了一种结合多头注意力与多任务学习的跨模态视频情感分析模型。对视频进行预处理,得到视频、音频、文本三个模态的特征表示。将得到的特征表示分别输入到GRU网络以提取时序特征。利用所提出的最大池化多头注意力机制,实现文本与视频、文本与音频的两两融合。将融合后的特征输入到情感分类与性别分类多任务网络得到说话人的情感极性与性别属性。实验结果表明,所提模型能够较好地利用模态间的差异信息与说话人性别属性,在有效提升情感识别准确率的同时降低了模型的空间复杂度。
-
关键词
视频情感分析
模态融合
多头注意力
多任务学习
模型复杂度
-
Keywords
video emotion analysis
modal fusion
multi-head attention
multi-task learning
model complexity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多模态融合的视频情感分析技术
被引量:1
- 2
-
-
作者
陈诗汉
马洪江
王婷
何松泽
-
机构
成都信息工程大学计算机学院
-
出处
《成都信息工程大学学报》
2022年第6期656-661,共6页
-
基金
四川省科技厅重点研发资助项目(2021YFG0031、2022YFG0375)
四川省科技服务业示范资助项目(2021GFW130)
-
文摘
介绍一种视频多模态情感识别方法。一个视频通常通过文本、声音和视觉图像等多模态信息来表达同一种情感主题,而如何将同一个视频中不同异构数据之间的信息融合并最大程度地利用是目前需要重点攻克的难题。通过互信息最大化的方法,高效融合视频中的文本、声音与视觉图像等多模态异构数据,尽可能多地消除模态之间的差异,最终实现对视频的情感进行识别分析。在公开的MOSEI多模态数据集上进行实验,实验结果显示MAE值达55.4。相比之前的一些模型,本模型效果更优,且实验模型构造不繁琐,为后面相关的研究打下良好的基础。
-
关键词
多模态融合
视频情感分析
互信息最大化
-
Keywords
multimodal fusion
video sentiment analysis
mutual information maximization
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP391.1
[自动化与计算机技术—计算机应用技术]
TN912.3
[电子电信—通信与信息系统]
-
-
题名个性化视频情感内容分析:综述
- 3
-
-
作者
张立刚
张九龙
-
机构
西安理工大学计算机科学与工程学院
-
出处
《计算机科学》
CSCD
北大核心
2018年第1期24-28,共5页
-
基金
国家自然科学基金(61402362)
陕西省教育厅基金(16JK1553)
西安市碑林区科技局项目(GX1616)资助
-
文摘
个性化视频情感内容分析是近几年兴起的一个研究热点,其目的是基于视频用户的个人兴趣和爱好来向其推荐个性化的视频内容。然而,当前仍然缺乏对该研究方向的最新研究进展的综述和讨论。为解决此问题,从3个方面对该领域的研究成果进行论述,讨论了各类现有方法的优缺点、存在的问题和挑战,并对未来的研究方向提出一些思路和建议。
-
关键词
视频情感内容分析
个性化推荐
用户兴趣
综述
-
Keywords
Affective video content analysis
Personalized recommendation
Viewer interest
Review
-
分类号
TP391.44
[自动化与计算机技术—计算机应用技术]
-
-
题名一种新的视频兴奋内容建模和视频摘要提取方法
被引量:1
- 4
-
-
作者
卜庆凯
胡爱群
-
机构
东南大学信息科学与工程学院
-
出处
《信号处理》
CSCD
北大核心
2009年第8期1319-1324,共6页
-
基金
国家863基金资助项目(No.2007AA01Z432)
国家242信息安全计划资助课题成果(No.2006A07)
-
文摘
本文对基于运动矢量的运动量的建模方法进行了修正,同时引入语速这种音频特征,在综合了镜头变换率和声音能量两个特征基础之上,提出了一种新的兴奋建模和视频摘要统一框架。在该框架之内,首先对视频的兴奋内容进行建模得到兴奋时间曲线,之后,依据曲线中的极大值和极小值提取关键帧和精彩片断两种形式的视频摘要。实验证明本文建模方法是有效的,提取的视频摘要能够有效表示视频的内容,且具有良好的面向用户性和自适应性。提取的关键帧的有效性达到78%,足球片断的精彩有效性和排序的有效性分别达到81%和82%,篮球片断的精彩有效性和排序的有效性分别达到75%和76%。
-
关键词
视频情感分析
音视频特征
兴奋建模
视频摘要
-
Keywords
affective video analysis
audio-visual features
excitement modeling
video abstract
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-