基于知识蒸馏与迁移学习结合的多模态音乐情感识别被引量：6

Multimodal Music Emotion Recognition Based on Knowledge Distillation and Transfer Learning

下载PDF

导出

摘要音乐情感识别的难题是缺乏足够的标签数据或者只有类别不均衡的标签数据训练情感识别模型,准确地标注情感类别不仅成本高而且耗时,且对标注者有着较高的音乐背景要求;同时,音乐的情感往往受多种因素的影响,演唱方式、音乐风格、编曲方式、歌词等因素都会影响到音乐情感的传达.本文提出一种基于知识蒸馏与音乐曲风迁移学习结合的多模态方法,在20000首歌曲上验证了该方法的有效性.实验证明,与单一音频、单一歌词及单一音频与歌词多模态方法相比,该方法的情感识别准确率均有明显的提高,且泛化能力得到提升. The difficulty of music emotion recognition is the lack of enough label data or only the unbalanced label data to train emotion recognition model,and it is not only costly but also time-consuming to accurately label emotion categories,which requires knowledge background of music theory.At the same time,the emotion of music is often affected by many factors,which can be expressed through singing style,music arrangement,lyrics and other angles.This paper presents a multimodal method based on the combination of knowledge distillation and music style transfer learning,which is proved to be effective on 20000 songs.Experimental results show that compared with single audio,single lyrics and single audio,and lyrics multimodal method,the accuracy of emotion recognition of this method is significantly improved and the generalization ability is improved.

作者赵剑刘华平梁晓晶高月洁 ZHAO Jian;LIU Huaping;LIANG Xiaojing;GAO Yuejie(Laboratory of Audio and Video, Hangzhou Netease Cloud Music Technology Co. Ltd., Shanghai 200080, China)

机构地区杭州网易云音乐科技有限公司音视频实验室

出处《复旦学报（自然科学版）》 CAS CSCD 北大核心 2021年第3期309-314,322,共7页 Journal of Fudan University：Natural Science

关键词知识蒸馏迁移学习多模态音乐情感深度学习 knowledge distillation transfer learning multimodal music emotion deep learning

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献2

1陈晓鸥,杨德顺.音乐情感识别研究进展[J].复旦学报（自然科学版）,2017,56(2):136-148. 被引量：15
2王洁,朱贝贝.面向中文歌词的音乐情感分类方法[J].计算机系统应用,2019,28(8):24-29. 被引量：11

二级参考文献6

1孙守迁,王鑫,刘涛,汤永川.音乐情感的语言值计算模型研究[J].北京邮电大学学报,2006,29(z2):35-40. 被引量：9
2夏云庆,杨莹,张鹏洲,刘宇飞.基于情感向量空间模型的歌词情感分析[J].中文信息学报,2010,24(1):99-103. 被引量：21
3蒋盛益,阳垚,廖静欣.中文音乐情感词典构建及情感分类方法研究[J].计算机工程与应用,2014,50(24):118-121. 被引量：12
4邓永莉,吕愿愿,刘明亮,崔宇佳,陆起涌.基于中高层特征的音乐情感识别模型[J].计算机工程与设计,2017,38(4):1029-1034. 被引量：13
5陈晓鸥,杨德顺.音乐情感识别研究进展[J].复旦学报（自然科学版）,2017,56(2):136-148. 被引量：15
6黄仁,张卫.基于word2vec的互联网商品评论情感倾向研究[J].计算机科学,2016,43(S1):387-389. 被引量：51

共引文献21

1赵薇,王立昊,黄敬雯,周义楠.基于前向神经网络的音乐情感识别[J].中国传媒大学学报（自然科学版）,2018,25(4):1-5. 被引量：6
2李强,刘晓峰.基于PNN的音乐情感分类[J].计算机工程与设计,2019,40(2):528-532. 被引量：12
3王洁,朱贝贝.面向中文歌词的音乐情感分类方法[J].计算机系统应用,2019,28(8):24-29. 被引量：11
4郑旦.基于前向神经网络的音乐情感识别分类算法[J].信息技术,2019,43(12):57-61. 被引量：3
5王志刚.基于特征词位置因素的音乐情感智能分类算法[J].电子设计工程,2020,28(17):56-60. 被引量：1
6孟令红.复杂噪声环境中的音乐分类和检测模型[J].微型电脑应用,2020,36(10):107-109.
7商铭娟.浅析BILSTM在音乐情感识别中的应用[J].科学与信息化,2020(30):5-5.
8吴昊,张莹,杨嘉乐,杨元元.基于机器学习的影视音效识别分类研究[J].电声技术,2020,44(7):30-34.
9杨帆,余华平.中文歌词文本的情感分类综述[J].电脑知识与技术,2021,17(3):207-208. 被引量：1
10宁慧,南江萍.基于前向神经网络多特征融合算法的音乐情感鉴赏分类[J].微型电脑应用,2021,37(2):91-94. 被引量：2

同被引文献53

1张彤彤.“十四五”时期中华优秀传统民歌的发展路径探究[J].黄河之声,2022(2):27-29. 被引量：2
2张艺.中西方音乐异同初探[J].海南师范大学学报（社会科学版）,2012,25(5):142-144. 被引量：8
3李静,林鸿飞,李瑞敏.基于情感向量空间模型的歌曲情感标签预测模型[J].中文信息学报,2012,26(6):45-50. 被引量：7
4蒋盛益,阳垚,廖静欣.中文音乐情感词典构建及情感分类方法研究[J].计算机工程与应用,2014,50(24):118-121. 被引量：12
5陈晓鸥,杨德顺.音乐情感识别研究进展[J].复旦学报（自然科学版）,2017,56(2):136-148. 被引量：15
6李强,刘晓峰.基于PNN的音乐情感分类[J].计算机工程与设计,2019,40(2):528-532. 被引量：12
7张驰名,王庆凤,刘志勤,黄俊,周莹,刘启榆,徐卫云.基于深度迁移学习的肺结节辅助诊断方法[J].计算机工程,2020,46(1):271-278. 被引量：27
8杨媛.数字音乐学研究综述[J].北方音乐,2020,40(2):4-5. 被引量：1
9倪璐.基于音频与歌词双重模态的音乐情感分类方法设计[J].自动化技术与应用,2020,39(5):166-169. 被引量：6
10李洪伟,李海峰,马琳.基于动态脑网络的长时音乐情感研究[J].复旦学报（自然科学版）,2020,59(3):330-337. 被引量：4

引证文献6

1沈哲旭,曾景杰,丁健,杨亮,林鸿飞.基于预训练语言模型的电子乐谱情感分类研究[J].复旦学报（自然科学版）,2022,61(5):581-588. 被引量：2
2李凯鹏,王云葛,邵渊,吴星笑.面向水面轮船行为认知的海缆安全监控技术[J].电子设计工程,2022,30(22):52-56.
3张晶晶,陈伟,李庆珍.基于CNN和XLNet的音乐多模态情感分析方法[J].贵阳学院学报（自然科学版）,2023,18(2):34-39. 被引量：1
4程敏.基于多模态深度学习的音乐情感鉴赏分类方法[J].安阳工学院学报,2023,22(5):113-117.
5赵萌,王昊,李晓敏.中国民歌多情感识别及情感变化规律分析研究[J].数据分析与知识发现,2023,7(7):111-124.
6刘鹏.基于基音频率的数字化音乐情感分类方法[J].自动化技术与应用,2024,43(7):158-162.

二级引证文献3

1程敏.基于多模态深度学习的音乐情感鉴赏分类方法[J].安阳工学院学报,2023,22(5):113-117.
2刘挺.融合深度学习与自然语言处理的文本情感分析研究[J].信息与电脑,2023,35(20):82-84. 被引量：1
3刘丹霞,李西萍,路惠捷.混合F-MFCC参数与多项集成ML算法的音乐情感分类方法研究[J].现代科学仪器,2024,41(6):369-374.

1郑超群.声乐表演中的气息运用[J].黄河之声,2021(9):139-141.
2新疆维吾尔木卡姆艺术[J].语数外学习（初中版）,2021(3):2-2.

复旦学报（自然科学版）

2021年第3期

浏览历史

内容加载中请稍等...

基于知识蒸馏与迁移学习结合的多模态音乐情感识别被引量：6

参考文献2

二级参考文献6

共引文献21

同被引文献53

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于知识蒸馏与迁移学习结合的多模态音乐情感识别 被引量：6

参考文献2

二级参考文献6

共引文献21

同被引文献53

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于知识蒸馏与迁移学习结合的多模态音乐情感识别被引量：6