一种基于离散时延的鲁棒声源三维定位方法被引量：2

Robust speech source 3D localization method based on discrete time delay

下载PDF

导出

摘要为了减少相位变换加权的可控响应功率(SRP-PHAT)声源定位算法的计算量,提出一种基于离散时延的改进算法.该方法首先利用FFT将麦克风阵列的每一帧接受信号变换到频域,然后在频域补零至16倍帧长,再运用IFFT将所有麦克风对的广义互相关函数在搜索之前计算好,从而可大幅度减少计算量.频域补零提高了广义互相关函数的采样率,因而由时延离散带来的定位误差很小.仿真结果表明,无论在远场还是近场条件下,该算法均能将计算量降低一个数量级而保持原算法的鲁棒性. To reduce the computation load of the steered response power-phase transform（SRP-PHAT） which is a robust speech source localization algorithm,an improved SRP-PHAT algorithm based on discrete time delay is presented in this paper.In this method,a frame of signal from microphone arrays is transformed into frequency domain by FFT（fast Fourier transform）,then the sample points increase by 16 times by padding zeros in frequency domain.As a result,a generalized cross-correlation（GCC） of higher sampling rate can be achieved by taking IFFT（inverse fast Fourier transform）.All the GCCs can be calculated before searching;the computation load will be significantly reduced.Moreover,the localization errors introduced by discrete time delay are small enough to ignore because of the high sampling rate of GCC.Simulation results show that the method can save computation load by one order of magnitude,while still remaining robust in both far-field and near-field.

作者蔡卫平吴镇扬

机构地区东南大学信息科学与工程学院

出处《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2009年第1期1-5,共5页 Journal of Southeast University：Natural Science Edition

基金国家重点基础研究发展计划(973计划)资助项目(2002CB312102)

关键词麦克风阵列声源定位 SRP-PHAT算法 microphone arrays speech source localization SRP-PHAT（steer response power-phase transform） algorithm

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1Brandstein M S. A framework for speech source location using sensor arrays [D]. Providence, RI, USA: Brown University, 1995.
2Parisi R, Cirillo A, Panella M, et al. Source localization in reverberant environments by consistent peak selection[C ]//IEEE International Conference on Acoustics, Speech, and Signal Processing. Honolulu, HI, USA, 2007,1:37 -40.
3Talantzis F, Constantinides A G, Polymenakos L C. Estimation of direction of arrival using information theory [ J ]. IEEE Signal Processing Letters, 2005,12 ( 8 ) : 561 - 564
4李承智,曲天书,吴玺宏.一种改进的AEDA声源定位及跟踪算法[J].北京大学学报（自然科学版）,2005,41(5):809-814. 被引量：10
5DiBiase J H. A high-accuracy, low-latency technique for talker localization in reverberant environments using microphone arrays [ D]. Providence, RI, USA: Brown University ,2000.
6Griebel S M. A microphone array system for speech source localization, denoising, and dereverberation [D]. Cambridge, MA, USA: Harvard University, 2002.
7Zotkin D N, Duraiswami R. Accelerated speech source localization via a hierarchical search of steered response power [J ]. IEEE Trans on Speech Audio Process, 2004,12 ( 5 ) :499 - 508.
8Peterson J M, Kyriakakis C. Hybrid algorithm for robust, real-time source localization in reverberant environments [C ]//IEEE International Conference on Acoustics, Speech, and Signal Processing. Philadelphia, PA, USA, 2005,4 : 1053 - 1056.
9Do H, Silverman H F, Yu Ying. A real-time SRP- PHAT source location implementation using stochastic region contraction (SRC) on a large-aperture microphone array[ C ]//IEEE International Conference on Acoustics, Speech, and Signal Processing. Honolulu, HI, USA, 2007,1:121 - 124.
10Allen J B, Berkley D A. Image method for efficiently simulating small-room acoustics [ J ]. Journal of Acoustical Society of America, 1979,65 (4) : 943 - 950.

二级参考文献8

1Hahn W R, Tretter S A. Optimum Processing for Delay-Vector Estimation in Passive Signal Arrays. IEEE Trans Inform Theory, 1973, 19(5) :608-614.
2Strobel N, Meier T, Rabenstein R. Speaker Localization Using Steered Filteredand-Sum Beamformers. Proc Vision and Visualization '99. Erlangen, 1999.
3Wax M,Kailath T. Optimum Localization of Multiple Sources by Passive Arrays, IEEE Trans Inform Theory, 1973,19(5) :1 210-1 218.
4Youn D H, Ahmed N, Carter G C. On Using the LMS Algorithm for Time Delay Estimation. IEEE Trans Acoust,Speech, Signal Processing, 1982, 30(5) :798-801.
5Brandstein M, A Framework for Speech Source Localization Using Sensor Arrays: [ Thesis ]. Berkeley: Brown University, 1995.
6Rabinkin D V. Optimum Sensor Placement for Microphone Arrays: [ Thesis ] . New Brunswick Rusgers: The State University of New Jersey, 1997.
7PictureTel. A Dynamic Locating Camera, http://www.polycom.com/.
8Huang Yiteng( Arden). Real-Time Acoustic Source Localization with Passive Microphone Arrays : [ Thesis ]. Atlanta :Georgia Institute of Technology, 2001.

共引文献9

1陆静艳,朱守正.基于NLMS的AEDA声源估计优化算法[J].华东师范大学学报（自然科学版）,2007(5):113-117.
2张倩,冯海泓,陈友元.一种变步长的自适应特征值分解时延估计方法[J].声学技术,2009,28(2):137-141.
3李从清,孙立新,戴士杰,李洙梁.机器人听觉定位跟踪声源的研究与进展[J].燕山大学学报,2009,33(3):199-205. 被引量：15
4王勇,刘颖,刘建平.一种基于麦克风阵列的声源定位算法研究[J].现代电子技术,2011,34(19):61-64. 被引量：5
5张怡典.基于麦克风阵列的相容时延矢量声源定位方法[J].信息技术,2012,36(9):131-133. 被引量：1
6王楷,宗志亚,孙小惟,石为人.改进的自适应特征值分解声源定位算法研究[J].仪器仪表学报,2013,34(6):1241-1246. 被引量：12
7刘刚,张治中.一种具有听觉功能的智能视频监控系统[J].电视技术,2014,38(1):164-167. 被引量：2
8陈向阳,刘松,刘培,徐莹,沈超.时延估计的声源定位算法及MATLAB实现[J].武汉工程大学学报,2014,36(10):61-65. 被引量：2
9张涛,刘倩.基于麦克风阵列的车辆笛声定位算法研究[J].武警工程大学学报,2017,33(6):44-47.

同被引文献25

1谭颖,殷福亮,李细林.改进的SRP-PHAT声源定位方法[J].电子与信息学报,2006,28(7):1223-1227. 被引量：16
2居太亮,彭启琮,邵怀宗.基于麦克风阵列的近场声源定位子阵算法研究[J].电子测量与仪器学报,2006,20(5):50-55. 被引量：12
3ZIYATDINOV A,MARCO S, CHAUDRY A, et al. Drift compensation of gas sensor array data by common principal component analysis [ J ].Sensors and Actuators B: 2010,146 (2) :460-465.
4XU ZH, SHI X J,LU S S. Integrated sensor array optimization with statistical evaluation [ J ]. Sensors and Actuators B: 2010,149( 1 ) :239-244.
5OLDHAM J R, SAGERS J D, BLOTrER J D,et al. Development of a multi-microphone calibrator [ J ]. Applied Acoustics,2009,70(6) :790-798.
6SARRADJ E. A fast signal subspace approach for the determination of absolute levels from phased microphone array measurements [ J]. Journal of Sound and Vibration, 2010,329(9) :1553-1569.
7CAI W P, WANG SH K, WU ZH Y. Accelerated steered response power method for sound source localization using orthogonal linear array [ J ]. Applied Acoustics,2010,71 (2) :134-139.
8MILES R N, HOY R R. The development of a biologically inspired directional microphone for hearing aids [ J ]. Audiology and Neuro-Otology, 2006,11 (2) : 86-94.
9STANACEVIC M, CAUWENBERGHS G. Micropower gradient flow acoustic localizer[ J]. IEEE Trans. Circuits and Systems I: Regular Papers, 2005, 52 ( 10 ) : 2148-2157.
10GORE A, FAZEL A, CHAKRABARTTY S. Far-field acoustic source localization and bearing estimation using y- A learners [ J]. IEEE Transaction on Circuit and System I,doi. 10.1109/TCSI. 2009. 2027627.

引证文献2

1梁瑞宇,赵力,奚吉,张学武,王青云.基于听觉仿生和压缩感知的助听器声源定位方法[J].仪器仪表学报,2011,32(6):1390-1395. 被引量：7
2左炜,刘越.一种改进的SRP-PHAT宽带信源DOA估计算法[J].空军预警学院学报,2013,27(3):181-183.

二级引证文献7

1管啸天,戴士杰,王义,武方.基于听觉特性和过零点间隔的多声源定位算法[J].仪器仪表学报,2012,33(6):1224-1233. 被引量：5
2李磊,于海锋,闫永立,胡广辉,曹亚飞,雷雯,罗宁.基于LabVIEW的声学相控阵视频监控系统[J].电子测量技术,2013,36(4):11-14. 被引量：5
3路敬祎,叶东,陈刚,郭玉波,马雯萍.双五元十字阵被动声定位融合算法及性能分析[J].仪器仪表学报,2016,37(4):827-833. 被引量：15
4王耀军,林勇刚.压缩感知下的自适应声源定位估计[J].计算机工程与应用,2016,52(14):62-66. 被引量：2
5刘磊,段俊奇,刘轶铭,翁丽娜.基于听觉特征的舰船辐射噪声分类研究[J].中国电子科学研究院学报,2016,11(4):401-406. 被引量：5
6郑洋,唐加能,柳培忠,刘晓芳.数字助听器研究现状及其算法综述[J].海峡科学,2016,0(7):14-17. 被引量：6
7杨洋,王秀芹.基于声压幅度比的多声源分离定位决策研究[J].高技术通讯,2017,27(1):46-52. 被引量：2

1谭颖,殷福亮,李细林.改进的SRP-PHAT声源定位方法[J].电子与信息学报,2006,28(7):1223-1227. 被引量：16
2左炜,刘越.一种改进的SRP-PHAT宽带信源DOA估计算法[J].空军预警学院学报,2013,27(3):181-183.
3乔杰,李致金,赵力.二次加速SRP-PHAT声源定位算法[J].数据采集与处理,2011,26(6):681-685. 被引量：2
4王春艳,樊官民,孟杰.基于广义互相关函数的声波阵列时延估计算法[J].电声技术,2010,34(8):37-39. 被引量：8
5郭秀江,朱秀昌.一种适用于视频电话类图像的倒三角运动估计算法[J].南京邮电学院学报（自然科学版）,2005,25(3):64-66.
6赵小燕,周琳,吴镇扬.基于压缩感知的麦克风阵列声源定位算法[J].东南大学学报（自然科学版）,2015,45(2):203-207. 被引量：13
7倪志莲,蔡卫平,张怡典.基于子带可控响应功率的多声源定位方法[J].计算机工程与应用,2013,49(24):205-209. 被引量：6
8何欣欣,刘爱莲,刘伟,胡月.一种改进的超宽带室内定位方法[J].郑州轻工业学院学报（自然科学版）,2012,27(3):86-88.
9张慧敏,柴毅,周鑫.一种基于谱相减法的声信号时延估计[J].世界科技研究与发展,2011,33(4):641-642.
10张海鹏.基于相位变化率的三维定位技术[J].电子科技,2014,27(8):97-100.

东南大学学报（自然科学版）

2009年第1期

浏览历史

内容加载中请稍等...

一种基于离散时延的鲁棒声源三维定位方法被引量：2

参考文献10

二级参考文献8

共引文献9

同被引文献25

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

一种基于离散时延的鲁棒声源三维定位方法 被引量：2

参考文献10

二级参考文献8

共引文献9

同被引文献25

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

一种基于离散时延的鲁棒声源三维定位方法被引量：2