期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于SincNet增强的时延估计声源定位算法研究 被引量:1
1
作者 卢炽华 薛齐凡 +3 位作者 刘志恩 朱亚伟 彭文杰 李放 《武汉理工大学学报》 CAS 2023年第10期127-134,共8页
针对相位变换加权的广义互相关时延估计(GCC-PHAT)声源定位方法在低信噪比与高混响条件下定位精度较低的问题,提出一种基于SincNet神经网络和GCC-PHAT协同工作的室内声源定位算法。以LibriSpeech语音数据集作为声源输入,采用Sinc函数作... 针对相位变换加权的广义互相关时延估计(GCC-PHAT)声源定位方法在低信噪比与高混响条件下定位精度较低的问题,提出一种基于SincNet神经网络和GCC-PHAT协同工作的室内声源定位算法。以LibriSpeech语音数据集作为声源输入,采用Sinc函数作为滤波器构建SincNet主干网络结构,能够有效提取声源语音特征;将特征输入到GCC-PHAT模块进行相关性分析与特征降维;再通过多层感知网络(MLP)进一步提取高级特征,输出时延误差分类结果。实验结果表明,相对于SCOT/PHAT联合加权、卷积神经网络(CNN)、深层全连接后向传播神经网络(D-BPNN)等先进的声源定位算法,该算法具备更强的抗混响性能,且在不同信噪比和混响强度下,该算法的定位精度显著高于GCC-PHAT,SincNet提取的特征能有效增强时延估计的鲁棒性。 展开更多
关键词 声源定位 sincnet神经网络 GCC-PHAT 时延估计 多层感知网络
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部