哼唱检索中旋律特征的聚类与优化方法被引量：2

Melody Feature Clustering and Optimization for Query-by-humming

下载PDF

导出

摘要哼唱检索是音频检索的一个重要分支,其能够为用户提供一种方便快捷的全新体验。在检索过程中,由于同首歌的不同哼唱版本之间具有不容忽视的差异,因此对旋律特征进行精确匹配并无法得到理想的检索结果。针对这一问题,将基于优化初始聚类中心的k-means(optimized initial clustering center k-means,OICC k-means)聚类方法引入到哼唱检索系统中,通过对旋律特征进行聚类来充分学习不同旋律特征之间的结构相似性,从而将具有相似结构的旋律特征划分到同一聚类内给聚类编号,以为后端的旋律特征匹配提供更有效的标签。同时,考虑到聚类后的旋律特征可以进行进一步的特征表示,因此将聚类后的标签作为深度置信网络(deep belief networks,DBN)的输入标签并进行特征提取,以获取具有更强区分性的高层旋律特征,从而有效提升旋律特征的鲁棒性。在获取高层旋律特征后,需将聚类类别作为匹配标签,并进行哼唱检索即可。实验结果表明所提出的方法能够有效提升哼唱检索系统的性能。 Query-by-humming is an important branch of audio retrieval,and it can provide users with a new and convenient experience.During the retrieval process,since there are unignorable differences between different humming of the same song,it is difficult to obtain ideal results by accurate matching of the melody features.To solve this problem,the optimized initial clustering center k-means(OICC k-means)is introduced in the query-by-humming system.By clustering melody features to fully learn the structural similarity between different melody features,the melody features with similar structures are divided into the same cluster and the clusters are numbered,so as to provide more effective matching of melody features at the back end label.Meanwhile,considering that the clustered melody features can be further characterized,the clustered tags are used as the input tags of deep belief networks(DBN)and feature extraction is performed to obtain stronger discriminative characteristics the high-level melody features of the melody,thereby effectively improving the robustness of melody features.After obtaining the high-level melody features,it is necessary to use the cluster category as a matching tag and perform a humming search.Experimental results show that the proposed method can effectively improve the performance of humming retrieval system.

作者王宁陈晨陈德运何勇军 WANG Ning;CHEN Chen;CHEN De-yun;HE Yong-jun(School of Computer Science and Technology, Harbin University of Science and Technology, Harbin 150080, China)

机构地区哈尔滨理工大学计算机科学与技术学院

出处《哈尔滨理工大学学报》 CAS 北大核心 2022年第1期61-68,共8页 Journal of Harbin University of Science and Technology

基金国家自然科学基金(62101163,61673142) 黑龙江省自然科学基金(LH2021F029,JJ2019JQ0013) 黑龙江省博士后专项经费(LBH-Z20020) 黑龙江省普通高校基本科研业务费专项资金(2020-KYYWF-0341).

关键词哼唱检索旋律特征提取 K-MEANS聚类算法深度置信网 query-by-humming melody segmentation k-means clustering algorithm deep belief network

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1李兰英,周志刚,陈德运.DBN和CNN融合的脱机手写汉字识别[J].哈尔滨理工大学学报,2020,25(3):137-143. 被引量：7
2王卫兵,张立超,徐倩.一种基于受限波尔兹曼机的推荐算法[J].哈尔滨理工大学学报,2020,25(5):62-67. 被引量：4
3韩剑辉,唐俊超.空间约束密度聚类的超像素分割算法[J].哈尔滨理工大学学报,2020,25(6):131-136. 被引量：2
4汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：140

二级参考文献29

1李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
2钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
3Han J, Kamber M. Data Mining Concepts and Techniques. Orlando, USA: Morgan Kaufmann Publishers, 2001
4Huang J Z, Ng M K, Rang Hongqiang, et al. Automated Variable Weighting in K-means Type Clustering. IEEE Trans on Pattern Analysis and Machine Intelligence, 2005, 27 (5) : 657 - 668
5Dhillon I S, Guan Yuqiang, Kogan J. Refining Clusters in High Dimensional Text Data//Proc of the 2nd SIAM Workshop on Clustering High Dimensional Data. Arlington, USA, 2002 : 59 - 66
6Zhang B. Generalized K-Harmonic Means: Dynamic Weighting of Data in Unsupervised Learning//Proc of the 1 st SIAM International Conference on Data Mining. Chicago, USA, 2001 : 1 - 13
7Sarafis I, Zalzala A M S, Trinder P W. A Genetic Rule-Based Data Clustering Toolkit//Proc of the Congress on Evolutionary Computation. Honolulu, USA, 2002 : 1238 - 1243
8Ma J, Perkins S. Time-Series Novelty Detection Using One-Class Support Vector Machines// Proc of the International Joint Conference on Neural Networks. Portland, USA, 2003, Ⅲ: 1741 - 1745
9Kaufman L,Rousseeuw P J. Finding Groups in Data: An Introduction to Cluster Analysis. New York, USA: John Wiley & Sons, 1990
10Rui Xu, Wunsch D I I. Survey of Clustering Algorithms. IEEE Trans on Neural Networks, 2005, 16(3 ) : 645 -678

共引文献149

1王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
2陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
3孙可,刘杰,王学颖.K均值聚类算法初始质心选择的改进[J].沈阳师范大学学报（自然科学版）,2009,27(4):448-450. 被引量：15
4刘金岭.基于语义的中文文本聚类最佳簇数研究[J].计算机工程与设计,2010,31(9):2034-2036.
5杨瑞龙,朱庆生,谢洪涛.快速混合Web文档聚类[J].计算机工程与应用,2010,46(22):12-15. 被引量：3
6王春艳,程霜梅,杨鑫.基于聚簇样本约减的K-近邻神经网络分类器[J].情报科学,2010,28(10):1547-1549.
7姚跃华,史秀岭.一种优化初始中心的K-means粗糙聚类算法[J].计算机工程与应用,2010,46(34):126-128. 被引量：14
8苏喻,郑诚,封军.文本聚类中基于密度聚类算法的研究与改进[J].微型机与应用,2011,30(1):1-3. 被引量：2
9崔春生,吴祈宗,王莹.用于推荐系统聚类分析的用户兴趣度研究[J].计算机工程与应用,2011,47(7):226-228. 被引量：15
10张燕平,张娟,何成刚,褚维翠,张利娜.基于佳点集与Leader方法的改进K-means聚类算法[J].计算机应用,2011,31(5):1359-1362. 被引量：3

同被引文献11

1余程年,杜梦丽,吴其林,张勇.基于多级度量学习的细粒度旋律相似判别算法[J].绥化学院学报,2023,43(3):147-152. 被引量：1
2杨汶雯,石梦荧.基于深度学习的音乐特征提取及流派分类[J].长江信息通信,2021,34(5):9-11. 被引量：4
3任瑞.基于音频特征的音乐音符智能切分识别方法[J].信息技术,2021,45(12):31-36. 被引量：3
4倪嘉惠,金文清,黄荣,韩芳.基于顶层反馈和联合检测的主旋律提取算法[J].计算机应用,2021,41(S02):103-107. 被引量：1
5王力,王鑫,谢凌云.音乐信号处理的特征分析综述[J].中国传媒大学学报（自然科学版）,2021,28(6):59-72. 被引量：3
6张岩,刘哲.基于CQT的乐器独奏单旋律的提取[J].沈阳师范大学学报（自然科学版）,2021,39(5):465-469. 被引量：1
7常凤,徐小华,胡忠旭.基于贝叶斯判别法对音乐特征信号的分类研究[J].电脑知识与技术,2022,18(13):79-81. 被引量：3
8王昊,刘渊晨,赵萌,裘靖文.基于多模态特征的音乐情感多任务识别研究[J].现代情报,2022,42(11):61-75. 被引量：3
9张李明,洪蕾.基于双阈值函数的音符检测旋律时间序列化分析[J].电子技术（上海）,2022,51(9):22-25. 被引量：2
10牛育谦,杨艺媛.基于谐波结构的民族乐器音色特征提取[J].自动化与仪器仪表,2023(4):34-38. 被引量：1

引证文献2

1贾继华,许耀奎,王明辉.双自编码结合变分贝叶斯的单细胞RNA-Seq聚类[J].哈尔滨理工大学学报,2024,29(3):125-133.
2周乙轩.基于差分Mel倒谱法的音乐旋律特征提取算法[J].赤峰学院学报（自然科学版）,2024,40(9):70-74.

1杨恩平,薛栋吉.基于深度学习的控制器设计研究[J].计算机与数字工程,2022,50(3):656-659. 被引量：1
2郭志涛,段弢,杨玉杰.一种基于DBN的漏电保护器故障诊断系统[J].现代电子技术,2022,45(8):121-125. 被引量：1
3孙林,刘梦含,徐久成.基于优化初始聚类中心和轮廓系数的K-means聚类算法[J].模糊系统与数学,2022,36(1):47-65. 被引量：44
4王喆.基于K-means聚类算法的章程文本数据安全智能检验分析系统设计[J].自动化与仪器仪表,2022(3):96-100. 被引量：6
5郭文娟.基于优化初始聚类中心的K-means聚类算法[J].科技风,2022(4):63-65. 被引量：8
6刘健,徐伟,钱炜.基于深度置信网络的心电信号分类识别[J].计算机与数字工程,2022,50(3):559-564. 被引量：2
7段友祥,张晓天.基于主动学习的SVM评论内容分类算法的研究[J].计算机与数字工程,2022,50(3):608-612. 被引量：6
8杨艳红,钟宝江,田宏伟.DS-YOLOv4-tiny救援机器人目标检测模型[J].计算机仿真,2022,39(1):387-393. 被引量：11
9张闻中,华守彤,陈逸,林义杰.基于智能定位的工业现场全天候监控视频异常检测研究[J].制造业自动化,2022,44(3):201-204. 被引量：2
10张宇航,张乾,江漫,苏江涛.基于跳跃连接的生成对抗网络人脸修复算法[J].湖南城市学院学报（自然科学版）,2022,31(2):60-65.

哈尔滨理工大学学报

2022年第1期

浏览历史

内容加载中请稍等...

哼唱检索中旋律特征的聚类与优化方法被引量：2

参考文献4

二级参考文献29

共引文献149

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

哼唱检索中旋律特征的聚类与优化方法 被引量：2

参考文献4

二级参考文献29

共引文献149

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

哼唱检索中旋律特征的聚类与优化方法被引量：2