-
题名哼唱检索中旋律特征的聚类与优化方法
被引量:2
- 1
-
-
作者
王宁
陈晨
陈德运
何勇军
-
机构
哈尔滨理工大学计算机科学与技术学院
-
出处
《哈尔滨理工大学学报》
CAS
北大核心
2022年第1期61-68,共8页
-
基金
国家自然科学基金(62101163,61673142)
黑龙江省自然科学基金(LH2021F029,JJ2019JQ0013)
+1 种基金
黑龙江省博士后专项经费(LBH-Z20020)
黑龙江省普通高校基本科研业务费专项资金(2020-KYYWF-0341).
-
文摘
哼唱检索是音频检索的一个重要分支,其能够为用户提供一种方便快捷的全新体验。在检索过程中,由于同首歌的不同哼唱版本之间具有不容忽视的差异,因此对旋律特征进行精确匹配并无法得到理想的检索结果。针对这一问题,将基于优化初始聚类中心的k-means(optimized initial clustering center k-means,OICC k-means)聚类方法引入到哼唱检索系统中,通过对旋律特征进行聚类来充分学习不同旋律特征之间的结构相似性,从而将具有相似结构的旋律特征划分到同一聚类内给聚类编号,以为后端的旋律特征匹配提供更有效的标签。同时,考虑到聚类后的旋律特征可以进行进一步的特征表示,因此将聚类后的标签作为深度置信网络(deep belief networks,DBN)的输入标签并进行特征提取,以获取具有更强区分性的高层旋律特征,从而有效提升旋律特征的鲁棒性。在获取高层旋律特征后,需将聚类类别作为匹配标签,并进行哼唱检索即可。实验结果表明所提出的方法能够有效提升哼唱检索系统的性能。
-
关键词
哼唱检索
旋律特征提取
K-MEANS聚类算法
深度置信网
-
Keywords
query-by-humming
melody segmentation
k-means clustering algorithm
deep belief network
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-