-
题名基于GRU与自注意力网络的声源到达方向估计
被引量:1
- 1
-
-
作者
何儒汉
陈一帆
余永升
姜艾森
-
机构
纺织服装智能化湖北省工程研究中心
武汉纺织大学计算机与人工智能学院
武汉理工大学硅酸盐建筑材料国家重点实验室
武汉纺织大学技术研究院
-
出处
《计算机科学》
CSCD
北大核心
2023年第S02期986-992,共7页
-
基金
国家自然科学基金面上项目(61170093)。
-
文摘
基于神经网络的声源定位近年来受到广泛的关注,但如何缓解隐含DOA位置信息丢失、小样本数据等问题仍然是目前面临的挑战,因此提出了一种基于GRU和自注意力网络的声源到达方向估计方法。该方法采用对小型数据集效果较好的GRU作为骨干网络,弥补了纯净的声音数据采集困难的问题;同时,该方法使用多声道录音的声源形成训练集,经过短时傅里叶变换特征提取得到梅尔频谱图和声学强度矢量,进而形成由多通道语谱图以及归一化的主特征向量叠加的输入特征,避免了对语谱图与GCC-PHAT特征结合的隐式DOA信息的破坏,有效缓解了隐含DOA位置信息丢失问题;将其作为输入进入卷积循环神经网络模型进行监督学习获得模型参数。模型输出使用三维笛卡尔积坐标回归获得DOA位置估计,并增加自注意力网络在模型训练时进行参数回传,使得网络在训练的同时计算损失并预测关联矩阵,以解决预测定位和参考定位之间的最优分配。实验结果表明,该网络在不同混响条件和信噪比的环境下,均具有较高的定位准确率和鲁棒性。
-
关键词
声源到达方向估计
GRU
卷积神经网络
循环神经网络
自注意力
-
Keywords
Sound source direction of arrival estimation
GRU
Convolutional neural network
Recurrent neural networks
Self-attention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-