基于模型在线更新和平滑处理的音乐分割算法被引量：2

Music segmentation based on model adaptation and smoothing processing

下载PDF

导出

摘要针对音乐分割中预训练模型和待分割信号间的不匹配问题,提出基于置信测度的自适应模型更新算法.在基于预训练模型的识别结果中,通过置信测度选择可靠的数据进行高斯混合模型在线自适应更新,获得与待分割音乐信号更匹配的声乐/非声乐模型.通过对识别结果进行平滑处理,进一步去除瞬时突变错误.实验表明,与初始模型和采用全部数据进行模型更新相比,该算法可获得与待分割信号更匹配的高斯混合模型,分割效果更佳. An online model adaptation technique for music segmentation was proposed.A confidence measure derived from the recognition likelihoods was adopted for selecting the credible data.The selected data was then used for model adaptation.Compared to the pre-trained models,the adapted ones characterize the acoustic properties of the processing signals more accurately.It implies that higher segmentation accuracy can be achieved.A smoothing processing was applied to further reduce the short segment fluctuation errors from the recognition output.Experimental results show that the significant performance improvement due to the proposed algorithms.

作者郑能恒张亚磊李霞

机构地区深圳大学信息工程学院

出处《深圳大学学报（理工版）》 EI CAS 北大核心 2011年第3期271-275,共5页 Journal of Shenzhen University(Science and Engineering)

基金国家自然科学基金资助项目(60901061) 广东省自然科学基金资助项目(9151806001000025)~~

关键词声学语音处理音乐分割高斯混合模型置信测度自适应模型更新平滑处理 acoustic speech processing music segmentation Gaussian mixture model confidence measure model adaptation smoothing

分类号 TN912 [电子电信—通信与信息系统] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1LiY WangD.单通道音乐中的歌声和伴奏乐分离.IEEE音频、语音和语言处理汇刊,2007,15(4):1475-1487.
2TardonL Sammartinos BarbanehoI.音乐/语音分离器的设计.美国声学学会杂志,2010,127(1):271-279.
3谢磊.韵律特征在中文新闻节目故事分割中的应用.多媒体系统,2008,14(4):237-253.
4Cheng S,Wang H,Fu H.基于贝叶斯准则的音频分割[C] //IEEE声学、语音和信号处理国际会议论文集.拉斯维加斯:IEEE出版社,2008:4881-4884.
5Zhang Y,Zhou J.基于多层次分类的音频分割[C] //IEEE声学、语音和信号处理国际会议论文集.蒙特利尔(加拿大):.IEEE出版社,2004:349-352.
6LuL ZhangH LjS.基于内容分析的音频信号分类与分割.IEEE语音与音频处理汇刊,2002,10(7):504-516.
7Chou W,Gu L.基于歌声检测的语音/音乐分割算法[c] //IEEE声学、语音和信号处理国际会议论文集.盐湖城:IEEE出版社,2001:865-868.
8Du Y,Hu W,Yan Y,等.基于三模型贝叶斯准则的音频分割[C] //IEEE声学、语音和信号处理国际会议论文集.夏威夷(美国):IEEE出版社,2007:205-208.(英义版).
9Kos M,Grasic M,Vlaj D,等.广播新闻中的语音/音乐在线分割[C] //第16届系统、信号与图像处理国际会议论文集.哈尔基斯(希腊):IEEE出版社,2009:1-4.
10SuJ YehH YuP等.基于内容和上下文的音乐推荐.智能系统,2010,25(1):16-26.

同被引文献11

1张一彬,周杰,边肇祺,张大鹏.一种基于内容的音频流二级分割方法[J].计算机学报,2006,29(3):457-465. 被引量：7
2ISHI C T, ISHIGURO H, HAGITA N. Automatic extraction of para- linguistic information using prosodic features related to F0, duration and voice quality[ J]. SCI, Speech Communication 50, 2008 : 531 - 543.
3CHENG S S, WANG H M.A. Sequential metric to based audio segmen- tation method via the Bayesian information criterion [ C]// Proceedings of Eurospeech. Geneva: University of Geneva, 2003:945 -948.
4CHEN S S, GOPLALAKRISHNAN P. Speaker, environment and channel change detection and clustering via the Bayesian information criterion [ C ]// proceedings of the DARPA workshop. Lansdowne : [ s. n. ] , 1988 : 127 - 132.
5CETI'OLO M, VESCOVI M. Efficient audio segmentation algorithms based on the BIC [ C ]//Proceedings of the International Conference on Acoustics, Speech, and Signal Processing, Hang Kong : IEEE, 2003 : 537 - 540.
6Cettolo M, Vescovi M, Rizzi R. Evaluation of BIC based algorithms for audio segmentation [ J]. Computer Speech and Language, 2005, 19f2) : 147 -170.
7MAO QiRong, WANG XiaoJia, ZHAN YongZhao. Speech emotion recognition method based on improved decision tree and layered fea- ture selection [ J ]. International Journal of Humanoid Robotics, 2010:245 - 261.
8王天江,陈刚,刘芳.一种按节拍动态分帧的歌曲有歌唱部分检测新方法[J].小型微型计算机系统,2009,30(8):1561-1564. 被引量：2
9于俊清,胡小强,孙凯.改进的音频混合分割方法[J].计算机辅助设计与图形学学报,2010,22(7):1174-1181. 被引量：4
10严宇,吴功平,杨展,王伟,徐显金.基于模型的巡线机器人无碰避障方法研究[J].武汉大学学报（工学版）,2013,46(2):261-265. 被引量：9

引证文献2

1赵小蕾,赵慧青.说话人功能性副语音自动检测算法[J].智能计算机与应用,2015,5(1):73-76. 被引量：1
2吕兰兰.基于MFCC特征聚类变换的歌曲中歌声的识别[J].电脑知识与技术,2016,0(11):170-171.

二级引证文献1

1孙颖,周雅茹,张雪英.融合功能性副语言比例系数的语音情感识别[J].东北大学学报（自然科学版）,2024,45(1):40-48.

1孙巧,张胜修,曹立佳,李小锋,刘毅男.自适应模型更新的粒子滤波视觉跟踪[J].电光与控制,2017,24(2):1-5. 被引量：2
2丁玉国,刘加,刘润生.嵌入式系统上的实时语音识别算法[J].数据采集与处理,2005,20(3):302-305. 被引量：6
3张铮,周会平.一种基于支持向量机的演唱片段划分方法[J].计算机与现代化,2009(3):127-129. 被引量：1
4李海洋,韩纪庆,郑贵滨,郑铁然.语音关键词检测中置信测度方法研究综述[J].智能计算机与应用,2014,4(2):10-15.
5薛蕙(编译),姜劲(校).电源故障大多数是可以预防的[J].磁性元件与电源,2014(1):157-157.
6蒋盛益,李霞,李碧,王连喜.音乐情感自动分析研究[J].计算机工程与设计,2010,31(18):4112-4115. 被引量：8
7李小红,钱源诚.高斯白噪声下LMS算法的改进[J].合肥工业大学学报（自然科学版）,1998,21(5):22-27.
8杨海军,郭美凤,滕云鹤.GPS定位信号随机误差自适应模型[J].数值计算与计算机应用,2000,21(1):22-27. 被引量：2
9李正涛,赵环宇,马献果.应用粒子群算法从已知数据中确定置信测度和似然测度[J].河北科技大学学报,2011,32(2):128-132. 被引量：3
10董明,刘加,刘润生.快速口音自适应的动态说话人选择性训练[J].清华大学学报（自然科学版）,2005,45(7):912-915. 被引量：1

深圳大学学报（理工版）

2011年第3期

浏览历史

内容加载中请稍等...

基于模型在线更新和平滑处理的音乐分割算法被引量：2

参考文献14

同被引文献11

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于模型在线更新和平滑处理的音乐分割算法 被引量：2

参考文献14

同被引文献11

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于模型在线更新和平滑处理的音乐分割算法被引量：2