翻唱歌曲识别是音乐信息检索(Music Information Retrieval, MIR)领域最具挑战性的任务之一。为了提高翻唱歌曲识别(Cover Song Identification, CSI)的准确率,研究者提出了多音频特征相似度张量积图融合的翻唱识别模型,但相似度高维空...翻唱歌曲识别是音乐信息检索(Music Information Retrieval, MIR)领域最具挑战性的任务之一。为了提高翻唱歌曲识别(Cover Song Identification, CSI)的准确率,研究者提出了多音频特征相似度张量积图融合的翻唱识别模型,但相似度高维空间几何结构的学习大幅度增加了模型的时间复杂度,同时该模型没有考虑歌词对翻唱识别的重要性。本文提出了基于音频内容和歌词文本相似度融合的翻唱识别模型。采用深度学习的方法分别提取音频特征和歌词特征,并采用相似度网络融合模型对这两种特征的相似度进行融合。为了验证算法的有效性,构建了Covers2326多模态数据库。实验结果表明,与基于多音频特征相似度张量积图融合模型相比,本文模型取得了更高的识别准确率和更低的时间复杂度。展开更多
文摘翻唱歌曲识别是音乐信息检索(Music Information Retrieval, MIR)领域最具挑战性的任务之一。为了提高翻唱歌曲识别(Cover Song Identification, CSI)的准确率,研究者提出了多音频特征相似度张量积图融合的翻唱识别模型,但相似度高维空间几何结构的学习大幅度增加了模型的时间复杂度,同时该模型没有考虑歌词对翻唱识别的重要性。本文提出了基于音频内容和歌词文本相似度融合的翻唱识别模型。采用深度学习的方法分别提取音频特征和歌词特征,并采用相似度网络融合模型对这两种特征的相似度进行融合。为了验证算法的有效性,构建了Covers2326多模态数据库。实验结果表明,与基于多音频特征相似度张量积图融合模型相比,本文模型取得了更高的识别准确率和更低的时间复杂度。