期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
哼唱检索中旋律特征的聚类与优化方法 被引量:2
1
作者 王宁 陈晨 +1 位作者 陈德运 何勇军 《哈尔滨理工大学学报》 CAS 北大核心 2022年第1期61-68,共8页
哼唱检索是音频检索的一个重要分支,其能够为用户提供一种方便快捷的全新体验。在检索过程中,由于同首歌的不同哼唱版本之间具有不容忽视的差异,因此对旋律特征进行精确匹配并无法得到理想的检索结果。针对这一问题,将基于优化初始聚类... 哼唱检索是音频检索的一个重要分支,其能够为用户提供一种方便快捷的全新体验。在检索过程中,由于同首歌的不同哼唱版本之间具有不容忽视的差异,因此对旋律特征进行精确匹配并无法得到理想的检索结果。针对这一问题,将基于优化初始聚类中心的k-means(optimized initial clustering center k-means,OICC k-means)聚类方法引入到哼唱检索系统中,通过对旋律特征进行聚类来充分学习不同旋律特征之间的结构相似性,从而将具有相似结构的旋律特征划分到同一聚类内给聚类编号,以为后端的旋律特征匹配提供更有效的标签。同时,考虑到聚类后的旋律特征可以进行进一步的特征表示,因此将聚类后的标签作为深度置信网络(deep belief networks,DBN)的输入标签并进行特征提取,以获取具有更强区分性的高层旋律特征,从而有效提升旋律特征的鲁棒性。在获取高层旋律特征后,需将聚类类别作为匹配标签,并进行哼唱检索即可。实验结果表明所提出的方法能够有效提升哼唱检索系统的性能。 展开更多
关键词 哼唱检索 旋律特征提取 K-MEANS聚类算法 深度置信网
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部