期刊文献+

基于Matching Pursuit的音像信号的分析

Audio-visual Analysis Based on Mathicng Pursuit
下载PDF
导出
摘要 利用声音和视频数据的相关性可以检测出该音像信号中的发声源.传统的方法,对视频序列的表示是基于像素的方法,而对声音的表示运用的则是类似Fourier变换的方法,这些考虑的仅仅是边缘效应.本文提出了基于Matching Pursuit(MP)框架下表示音像信号的方法,利用冗余的字典能更好的表示信号结构中比较突出变化的部分,有效地减少了引入的信号的时变变量,利用Pearson系数,对测试序列进行了音像熔合分析,仿真结果表明能定位视频序列中声源的位置.
机构地区 江南大学
出处 《信号处理》 CSCD 北大核心 2005年第z1期327-330,共4页 Journal of Signal Processing
  • 相关文献

参考文献8

  • 1[1]H.McGurk and J.W.MacDonald, "Hearing lips and seeing voices", Nature, vol.264, no.5588, pp.746-748,1976.
  • 2[2]J.Hershey and J.Movellan, "Audio-vision: using audio-visual synchronization of video facial images and audio tracks ", in Proc. Of Neural Information Processing Society, vol. 12,1999.
  • 3[3]M. Slaney and M. Covell, "FaceSync: a linear operator for measuring synchronization of video facial images and audio tracks," in Proc.of Neural Information Processing Society, vol.12, 1999.
  • 4[4]J. W. Fisher Ⅲ and T. Darrell, "Speaker association with signal-level audiovisual fusion," IEEE Transactions on Multimedia, vol. 6, no. 3, pp. 406-413, June 2004.
  • 5[5]S.Mallat and Z.Zhang, "Matching pursuits with time-frequecy dictionaries", IEEE Transaction on Signal Processing, vol.41,pp.3397-3415,1993.
  • 6[6]O. Divorra Escoda and P. Vandergheynst, "A Bayesian approach to video expansions on parametric over-complete 2-D dictionaries," in Proc. of IEEE MMSP, pp. 490-493, 2004.
  • 7[7]T. M. Cover and J. A. Thomas, "Elements of information theory", New York: John Wiley & Sons, 1991.
  • 8[8]http:∥www.cmap.polytechnique.fr/~bacry/LastWave/

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部