期刊文献+

基于模型在线更新和平滑处理的音乐分割算法 被引量:2

Music segmentation based on model adaptation and smoothing processing
下载PDF
导出
摘要 针对音乐分割中预训练模型和待分割信号间的不匹配问题,提出基于置信测度的自适应模型更新算法.在基于预训练模型的识别结果中,通过置信测度选择可靠的数据进行高斯混合模型在线自适应更新,获得与待分割音乐信号更匹配的声乐/非声乐模型.通过对识别结果进行平滑处理,进一步去除瞬时突变错误.实验表明,与初始模型和采用全部数据进行模型更新相比,该算法可获得与待分割信号更匹配的高斯混合模型,分割效果更佳. An online model adaptation technique for music segmentation was proposed.A confidence measure derived from the recognition likelihoods was adopted for selecting the credible data.The selected data was then used for model adaptation.Compared to the pre-trained models,the adapted ones characterize the acoustic properties of the processing signals more accurately.It implies that higher segmentation accuracy can be achieved.A smoothing processing was applied to further reduce the short segment fluctuation errors from the recognition output.Experimental results show that the significant performance improvement due to the proposed algorithms.
出处 《深圳大学学报(理工版)》 EI CAS 北大核心 2011年第3期271-275,共5页 Journal of Shenzhen University(Science and Engineering)
基金 国家自然科学基金资助项目(60901061) 广东省自然科学基金资助项目(9151806001000025)~~
关键词 声学 语音处理 音乐分割 高斯混合模型 置信测度 自适应模型更新 平滑处理 acoustic speech processing music segmentation Gaussian mixture model confidence measure model adaptation smoothing
  • 相关文献

参考文献14

  • 1LiY WangD.单通道音乐中的歌声和伴奏乐分离.IEEE音频、语音和语言处理汇刊,2007,15(4):1475-1487.
  • 2TardonL Sammartinos BarbanehoI.音乐/语音分离器的设计.美国声学学会杂志,2010,127(1):271-279.
  • 3谢磊.韵律特征在中文新闻节目故事分割中的应用.多媒体系统,2008,14(4):237-253.
  • 4Cheng S,Wang H,Fu H.基于贝叶斯准则的音频分割[C] //IEEE声学、语音和信号处理国际会议论文集.拉斯维加斯:IEEE出版社,2008:4881-4884.
  • 5Zhang Y,Zhou J.基于多层次分类的音频分割[C] //IEEE声学、语音和信号处理国际会议论文集.蒙特利尔(加拿大):.IEEE出版社,2004:349-352.
  • 6LuL ZhangH LjS.基于内容分析的音频信号分类与分割.IEEE语音与音频处理汇刊,2002,10(7):504-516.
  • 7Chou W,Gu L.基于歌声检测的语音/音乐分割算法[c] //IEEE声学、语音和信号处理国际会议论文集.盐湖城:IEEE出版社,2001:865-868.
  • 8Du Y,Hu W,Yan Y,等.基于三模型贝叶斯准则的音频分割[C] //IEEE声学、语音和信号处理国际会议论文集.夏威夷(美国):IEEE出版社,2007:205-208.(英义版).
  • 9Kos M,Grasic M,Vlaj D,等.广播新闻中的语音/音乐在线分割[C] //第16届系统、信号与图像处理国际会议论文集.哈尔基斯(希腊):IEEE出版社,2009:1-4.
  • 10SuJ YehH YuP等.基于内容和上下文的音乐推荐.智能系统,2010,25(1):16-26.

同被引文献11

  • 1张一彬,周杰,边肇祺,张大鹏.一种基于内容的音频流二级分割方法[J].计算机学报,2006,29(3):457-465. 被引量:7
  • 2ISHI C T, ISHIGURO H, HAGITA N. Automatic extraction of para- linguistic information using prosodic features related to F0, duration and voice quality[ J]. SCI, Speech Communication 50, 2008 : 531 - 543.
  • 3CHENG S S, WANG H M.A. Sequential metric to based audio segmen- tation method via the Bayesian information criterion [ C]// Proceedings of Eurospeech. Geneva: University of Geneva, 2003:945 -948.
  • 4CHEN S S, GOPLALAKRISHNAN P. Speaker, environment and channel change detection and clustering via the Bayesian information criterion [ C ]// proceedings of the DARPA workshop. Lansdowne : [ s. n. ] , 1988 : 127 - 132.
  • 5CETI'OLO M, VESCOVI M. Efficient audio segmentation algorithms based on the BIC [ C ]//Proceedings of the International Conference on Acoustics, Speech, and Signal Processing, Hang Kong : IEEE, 2003 : 537 - 540.
  • 6Cettolo M, Vescovi M, Rizzi R. Evaluation of BIC based algorithms for audio segmentation [ J]. Computer Speech and Language, 2005, 19f2) : 147 -170.
  • 7MAO QiRong, WANG XiaoJia, ZHAN YongZhao. Speech emotion recognition method based on improved decision tree and layered fea- ture selection [ J ]. International Journal of Humanoid Robotics, 2010:245 - 261.
  • 8王天江,陈刚,刘芳.一种按节拍动态分帧的歌曲有歌唱部分检测新方法[J].小型微型计算机系统,2009,30(8):1561-1564. 被引量:2
  • 9于俊清,胡小强,孙凯.改进的音频混合分割方法[J].计算机辅助设计与图形学学报,2010,22(7):1174-1181. 被引量:4
  • 10严宇,吴功平,杨展,王伟,徐显金.基于模型的巡线机器人无碰避障方法研究[J].武汉大学学报(工学版),2013,46(2):261-265. 被引量:9

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部