-
题名基于频域稀疏自编码网络的音乐分离技术
- 1
-
-
作者
曹偲
吴修坤
刘华平
-
机构
网易云音乐杭州网易云音乐科技有限公司技术中心
-
出处
《电声技术》
2020年第6期91-94,共4页
-
文摘
音乐分离技术通常是将歌曲中的伴奏和干声进行分离,或者是将干声、贝斯、鼓点等成分进行分轨,具有较高的学术研究价值和商业价值。音乐分离可以应用于重新混音编曲、伴奏库生成以及MIDI信息获取等。近几年,基于深度学习的音乐分离方法取得了极大进展,Spleeter方法和Demucs方法极大地提高了音乐的分离质量。但是,音乐分离任务中分离伴奏的完整性、分离引入的失真等问题依然没有得到很好地解决,因此试图提出了一种基于频域稀疏自编码网络结构来提高音乐分离的效果。它的核心思想是使用编码器-解码器框架对频域信号进行建模,并采用CNN网络对编码器输出结果进行源分离任务。该方法提升了分离伴奏的保真度,提高了分离算法的效率和稳定性。MUSDB18测试集上的实验结果表明,该方法在多个客观指标上都达到了最优。
-
关键词
音乐分离
稀疏自编码
深度学习
-
Keywords
music separation
sparse auto-encoder
deep learning
-
分类号
TN912.3
[电子电信—通信与信息系统]
TP18
[自动化与计算机技术—控制理论与控制工程]
-