-
题名基于SincNet增强的时延估计声源定位算法研究
被引量:1
- 1
-
-
作者
卢炽华
薛齐凡
刘志恩
朱亚伟
彭文杰
李放
-
机构
武汉理工学大学汽车工程学院
武汉理工大学现代汽车零部件技术湖北省重点实验室
-
出处
《武汉理工大学学报》
CAS
2023年第10期127-134,共8页
-
基金
国家自然科学基金(52175111)
湖北省重点研发计划(2021BAA177)。
-
文摘
针对相位变换加权的广义互相关时延估计(GCC-PHAT)声源定位方法在低信噪比与高混响条件下定位精度较低的问题,提出一种基于SincNet神经网络和GCC-PHAT协同工作的室内声源定位算法。以LibriSpeech语音数据集作为声源输入,采用Sinc函数作为滤波器构建SincNet主干网络结构,能够有效提取声源语音特征;将特征输入到GCC-PHAT模块进行相关性分析与特征降维;再通过多层感知网络(MLP)进一步提取高级特征,输出时延误差分类结果。实验结果表明,相对于SCOT/PHAT联合加权、卷积神经网络(CNN)、深层全连接后向传播神经网络(D-BPNN)等先进的声源定位算法,该算法具备更强的抗混响性能,且在不同信噪比和混响强度下,该算法的定位精度显著高于GCC-PHAT,SincNet提取的特征能有效增强时延估计的鲁棒性。
-
关键词
声源定位
sincnet神经网络
GCC-PHAT
时延估计
多层感知网络
-
Keywords
sound source localization
sincnet neural network
GCC-PHAT
time delay estimation
MLP
-
分类号
O429
[理学—声学]
-