期刊文献+

联合音视频中的跟踪技术研究

原文传递
导出
摘要 为了解决目前说话人时间定位的跟踪方法中只采用音频特征的缺陷,本文提出了一种联合音视频的方法:首先采用视频信息,确定要跟踪的说话人的潜在目标,然后使用音频信息对潜在目标进行进一步的判决,最后完成说话人跟踪。实验结果表明,该方法避免了只使用音频信息需要为每个说话人进行改变检测和判决的缺点,联合音视频信息比单独使用视频信息在说话人正确跟踪率方面提高了33.65%,在说话人漏跟踪率方面二者是一样的。
出处 《网络安全技术与应用》 2015年第4期80-80,82,共2页 Network Security Technology & Application
  • 相关文献

参考文献10

二级参考文献61

  • 1杜江,朱柯.智能麦克风阵列语音分离和说话人跟踪技术研究[J].电子学报,2005,33(2):382-384. 被引量:9
  • 2胡士强,敬忠良.粒子滤波算法综述[J].控制与决策,2005,20(4):361-365. 被引量:293
  • 3Potamitis I,Chen H M,Tremoulis G.Tracking of multiple moving speakers with multiple microphone arrays.IEEE Transactions on Speech and Audio Processing,2004,12(5):520-529
  • 4Brandstein M A.A Framework for Speech Source Localization Using Sensor Arrays[Ph.D.dissertation],Brown University,USA,1995
  • 5Dvorkind T,Gannot S.Speaker localization exploiting spatial-temporal information.In:Proceedings of the IEEE International Workshop on Acoustic Echo and Noise Control.Kyoto,Japan:IEEE,2003.295-298
  • 6Gordon N J,Salmond D J,Smith A F M.Novel approach to nonlinear and non-Gaussian Bayesian state estimation,IEE Proceedings on Radar and Signal Processing,1993,140(2):107-117
  • 7Liu J S,Chen R.Sequential Monte Carlo methods for dynamic systems.Journal of the American Statistical Association,1998,93(443):1032-1044
  • 8Vermaak J,Blake A.Nonlinear filtering for speaker tracking in noisy and reverberant environments.In:Proceedings of the IEEE International Conference on Acoustics,Speech,and Signal Processing.Salt Lake City,USA:IEEE,2001.3021-3024
  • 9Ward D B,Lehmann E A,Williamson R C.Particle filtering algorithms for tracking an acoustic source in a reverberant environment.IEEE Transactions on Speech and Audio Processing,2003,11(6):826-836
  • 10Guo D,Wang X D.Quasi-Monte Carlo filtering in nonlinear dynamic systems.IEEE Transactions on Signal Processing,2006,54(6):2087-2098

共引文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部