-
题名基于循环神经网络的双麦克风语音增强算法
- 1
-
-
作者
邱智乾
陈霏
郎标
-
机构
天津大学微电子学院
深圳清华大学研究院
-
出处
《传感技术学报》
CAS
CSCD
北大核心
2024年第3期430-438,共9页
-
基金
国家重点研发计划项目(2016YFA0202201)
深圳市科技计划项目(JSGG20191129141019090,JCYJ20210324115610028,JSGG20210713091808027)。
-
文摘
针对基于神经网络的语音增强算法难以部署在助听器中的问题,基于循环神经网络,提出了一种低延迟、低复杂度的双麦克风语音增强算法。该算法利用两个麦克风做空域滤波初步去除非期望方向噪声,并进一步通过循环神经网络得到纯净语音信号。为了解决助听器中全相位滤波器组阶数较多而引起群延迟较大的问题,创新性地提出一种分段式滤波器组,在保证性能的同时有效减少了阶数。仿真结果显示,该滤波器组在16 k采样率下的群延迟为3.125 ms,在0 dB的babble、volvo、factory1环境下,该语音增强算法的SNR平均提升了10.556 5 dB,PESQ平均提升了0.678 7。实际测试结果中,SNR平均提升了9.439 4 dB,PESQ平均提升了0.735 0。当DSP系统时钟频率为104 MHz时,助听器经过的系统延迟为8.4 ms,功耗为6.2 mA,可以很好满足助听器高续航的需求。
-
关键词
语音增强
滤波器组
循环神经网络
助听器
DSP实现
-
Keywords
speech enhancement
filterbank
recurrent neural network
hearing aids
DSP implementation
-
分类号
TN492
[电子电信—微电子学与固体电子学]
-
-
题名基于循环神经网络的语音增强加速器设计
被引量:1
- 2
-
-
作者
郎标
陈霏
马偲
石东宇
姬俊宇
-
机构
天津大学微电子学院
深圳清华大学研究院
深圳市智听科技有限公司
-
出处
《传感技术学报》
CAS
CSCD
北大核心
2023年第4期555-564,共10页
-
基金
国家重点研发计划项目(2016YFA0202201)
深圳市科技计划项目(JSGG20191129141019090,JCYJ20210324115610028,JSGG20210713091808027)。
-
文摘
使用深度学习的语音增强技术能够提升听者的言语识别率,但因神经网络的规模较大难以应用于边缘设备中。因此,提出了一种可用于助听器等边缘设备的循环神经网络语音增强加速器。该加速器将神经网络的计算用独立矩阵乘法硬件实现,并在多层神经网络的层之间实现硬件级的流水操作,通过并行和流水降低了计算延时。实验表明,与带噪语音相比,在volvo、factory2、babble噪声环境下,所提算法的信噪比分别平均提升了17.302 dB、8.412 dB和4.732 dB;短时语音可懂度分别平均提高了1.4%、0.8%和0.4%;语音质量感知评估平均提高了1.498、0.504和0.234;这三项指标均高于所对比的传统语音增强算法与神经网络算法。当时钟频率为10 MHz时,加速器的处理延时为9.2 ms,可以满足边缘侧应用的实时性需求。
-
关键词
语音增强
边缘设备
循环神经网络
加速器
实时性
-
Keywords
speech enhancement
edge devices
recurrent neural network
accelerator
real⁃time
-
分类号
TN492
[电子电信—微电子学与固体电子学]
-
-
题名基于16子带滤波器组的助听器啸叫检测与抑制算法
- 3
-
-
作者
石东宇
陈霏
郎标
邱智乾
姬俊宇
-
机构
天津大学微电子学院
深圳清华大学研究院
深圳市智听科技有限公司
-
出处
《传感技术学报》
CAS
CSCD
北大核心
2023年第7期1032-1040,共9页
-
基金
国家重点研发计划项目(2016YFA0202201)
深圳市科技计划项目(JSGG20191129141019090,JCYJ20210324115610028,JSGG20210713091808027)。
-
文摘
听力损失患者在使用助听器的过程中,常常因为啸叫问题而倍感苦恼。基于陷波器的啸叫检测与抑制算法通常在DSP上进行实现,存在处理延迟高和资源消耗多的问题。为此,基于16子带的全相位FIR滤波器组,提出了一种低延迟、适合电路化的啸叫检测与抑制算法。对于一个指定的子带信号,当子带-低频平均能量比和子带-全带对数相似度同时大于0时,认为啸叫存在,之后降低该子带信号的增益值以抑制啸叫。仿真结果显示,相比于传统算法,当检测概率为88.57%时,所提算法的误警概率更低;平均最大稳定增益的增量更高,且语音质量感知评估值达3分以上。硬件测试中,系统处理延时为8.535 ms,能够及时地对啸叫进行检测与抑制,满足助听器资源消耗和实时处理的应用需求。
-
关键词
声反馈抑制
啸叫检测
滤波器组
助听器
FPGA实现
-
Keywords
acoustic feedback suppression
howling detection
filterbank
hearing aids
FPGA implementation
-
分类号
TN912.3
[电子电信—通信与信息系统]
-