联合音视频中的跟踪技术研究

导出

摘要为了解决目前说话人时间定位的跟踪方法中只采用音频特征的缺陷,本文提出了一种联合音视频的方法:首先采用视频信息,确定要跟踪的说话人的潜在目标,然后使用音频信息对潜在目标进行进一步的判决,最后完成说话人跟踪。实验结果表明,该方法避免了只使用音频信息需要为每个说话人进行改变检测和判决的缺点,联合音视频信息比单独使用视频信息在说话人正确跟踪率方面提高了33.65%,在说话人漏跟踪率方面二者是一样的。

作者田广利程洁马颖胡明刘磊

机构地区北京市微安全科技有限公司

出处《网络安全技术与应用》 2015年第4期80-80,82,共2页 Network Security Technology & Application

关键词联合音视频音频信息视频信息说话人跟踪

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1侯代文,殷福亮.基于粒子滤波的交互式多模型说话人跟踪方法[J].电子学报,2010,38(4):835-841. 被引量：13
2曹洁,李伟.基于正则化粒子滤波的说话人跟踪方法[J].兰州理工大学学报,2010,36(6):85-88. 被引量：7
3侯代文,殷福亮,陈喆.基于拟蒙特卡洛滤波的说话人跟踪方法[J].自动化学报,2009,35(7):1016-1021. 被引量：10
4侯代文,殷福亮,陈喆.基于分层采样粒子滤波的说话人跟踪方法[J].大连理工大学学报,2009,49(4):580-586. 被引量：2
5曹洁,李伟.一种改进的粒子滤波算法及其在说话人跟踪中的应用[J].小型微型计算机系统,2012,33(3):664-668. 被引量：3
6Maurice F.FaUon,Simon J.Godsil,Acoustic Source Localization and Tracking of a Time-Varying Number of Speakers,IEEE Transaction on audio,speech and language processing,2012.
7Andrey Ronzhin,Alexander Ronzhin,Viktor Budkov,Audiovisual speaker localization in medium smart meeting room,2011 8th International Conference on Information, Communications and Signal Processing ( ICICS 2011 ) :1-5.
8Axel Plinge,Daniel Hauschildt,etc.Multiple speaker tracking using a microphone array by combining auditory processing and a gaussian mixture cardinalized probability hypothesis density filter,2011 IEEE International Conference on Acoustics,Speech and Signal Processing ( ICASSP 2011 ) :2476-2479.
9Alireza Masnadi-shirazi,Bhaskar D.Rao,Separation and tracking of multiple speakers in a reverberant environment using a multiple model particle filter glimpsing method,2011 IEEE International Conference on Acoustics,Speech and Signal Processing ( ICASSP2011 ) :2516-2519.
10杨继臣,贺前华,李艳雄,王伟凝.一种两步判决的说话人分割算法[J].电子与信息学报,2010,32(8):2006-2009. 被引量：7

二级参考文献61

1杜江,朱柯.智能麦克风阵列语音分离和说话人跟踪技术研究[J].电子学报,2005,33(2):382-384. 被引量：9
2胡士强,敬忠良.粒子滤波算法综述[J].控制与决策,2005,20(4):361-365. 被引量：293
3Potamitis I,Chen H M,Tremoulis G.Tracking of multiple moving speakers with multiple microphone arrays.IEEE Transactions on Speech and Audio Processing,2004,12(5):520-529
4Brandstein M A.A Framework for Speech Source Localization Using Sensor Arrays[Ph.D.dissertation],Brown University,USA,1995
5Dvorkind T,Gannot S.Speaker localization exploiting spatial-temporal information.In:Proceedings of the IEEE International Workshop on Acoustic Echo and Noise Control.Kyoto,Japan:IEEE,2003.295-298
6Gordon N J,Salmond D J,Smith A F M.Novel approach to nonlinear and non-Gaussian Bayesian state estimation,IEE Proceedings on Radar and Signal Processing,1993,140(2):107-117
7Liu J S,Chen R.Sequential Monte Carlo methods for dynamic systems.Journal of the American Statistical Association,1998,93(443):1032-1044
8Vermaak J,Blake A.Nonlinear filtering for speaker tracking in noisy and reverberant environments.In:Proceedings of the IEEE International Conference on Acoustics,Speech,and Signal Processing.Salt Lake City,USA:IEEE,2001.3021-3024
9Ward D B,Lehmann E A,Williamson R C.Particle filtering algorithms for tracking an acoustic source in a reverberant environment.IEEE Transactions on Speech and Audio Processing,2003,11(6):826-836
10Guo D,Wang X D.Quasi-Monte Carlo filtering in nonlinear dynamic systems.IEEE Transactions on Signal Processing,2006,54(6):2087-2098

共引文献28

1李天成,孙树栋,司书宾,王军强.基于粒子聚合重采样的移动机器人蒙特卡洛定位[J].机器人,2010,32(5):674-680. 被引量：4
2曹洁,李伟.基于正则化粒子滤波的说话人跟踪方法[J].兰州理工大学学报,2010,36(6):85-88. 被引量：7
3曹洁,李伟.基于多特征融合的目标跟踪算法[J].兰州理工大学学报,2011,37(2):80-84. 被引量：15
4徐立中,丁晓峰,王鑫,吕国芳,黄凤辰.基于信赖域的序贯拟蒙特卡洛滤波算法[J].电子学报,2011,39(A03):24-30. 被引量：7
5马悦,秦前清,朱建章,胡亦钧.基于拟蒙特卡罗概率假设密度的卷积实现[J].电子学报,2011,39(A03):64-68.
6曹洁,李伟.一种高精度自适应粒子滤波算法[J].兰州理工大学学报,2011,37(3):83-88. 被引量：2
7曹洁,李伟.一种改进的粒子滤波算法及其在说话人跟踪中的应用[J].小型微型计算机系统,2012,33(3):664-668. 被引量：3
8杨继臣,李艳雄.新闻故事中的关键说话人发现方法[J].计算机工程与设计,2012,33(6):2353-2357. 被引量：1
9杨继臣,何俊,李艳雄.一种基于性别的说话人索引算法[J].计算机工程与科学,2012,34(6):79-82.
10曹洁,李军,李伟,吴迪.基于自适应有限差分粒子滤波的说话人跟踪[J].兰州理工大学学报,2012,38(5):93-97. 被引量：3

1曹洁,李军,李伟,吴迪.基于自适应有限差分粒子滤波的说话人跟踪[J].兰州理工大学学报,2012,38(5):93-97. 被引量：3
2李军,曹洁,李伟.噪声相关情况下说话人跟踪方法[J].计算机辅助设计与图形学学报,2014,26(12):2251-2257. 被引量：1
3金乃高,殷福亮.量子进化粒子滤波算法及其在说话人跟踪中的应用[J].信号处理,2008,24(6):982-987. 被引量：4
4金乃高,殷福亮,陈喆.基于动态贝叶斯网络的音视频联合说话人跟踪[J].自动化学报,2008,34(9):1083-1089. 被引量：7
5侯代文,殷福亮,陈喆.基于sigma点H∞滤波的说话人跟踪方法[J].信号处理,2009,25(3):374-378. 被引量：8
6曹洁,李伟,李军,王进花.强噪声背景下鲁棒的说话人跟踪[J].华中科技大学学报（自然科学版）,2015,43(S1):363-366. 被引量：4
7曹洁,李伟.一种改进的粒子滤波算法及其在说话人跟踪中的应用[J].小型微型计算机系统,2012,33(3):664-668. 被引量：3
8陈里铭,陈喆,殷福亮,侯代文.基于数值积分卡尔曼-概率假设密度滤波的多说话人跟踪方法[J].信号处理,2012,28(9):1209-1218. 被引量：1
9侯代文,殷福亮,陈喆.基于拟蒙特卡洛滤波的说话人跟踪方法[J].自动化学报,2009,35(7):1016-1021. 被引量：10
10高明,王春东,齐鸿飞.无线定位系统研究[J].天津理工大学学报,2006,22(5):50-52. 被引量：2

网络安全技术与应用

2015年第4期

浏览历史

内容加载中请稍等...

联合音视频中的跟踪技术研究

参考文献10

二级参考文献61

共引文献28

相关作者

相关机构

相关主题

浏览历史