摘要
利用声音和视频数据的相关性可以检测出该音像信号中的发声源.传统的方法,对视频序列的表示是基于像素的方法,而对声音的表示运用的则是类似Fourier变换的方法,这些考虑的仅仅是边缘效应.本文提出了基于Matching Pursuit(MP)框架下表示音像信号的方法,利用冗余的字典能更好的表示信号结构中比较突出变化的部分,有效地减少了引入的信号的时变变量,利用Pearson系数,对测试序列进行了音像熔合分析,仿真结果表明能定位视频序列中声源的位置.
出处
《信号处理》
CSCD
北大核心
2005年第z1期327-330,共4页
Journal of Signal Processing