-
题名基于感知掩蔽深度神经网络的单通道语音增强方法
被引量:18
- 1
-
-
作者
韩伟
张雄伟
闵刚
张启业
-
机构
解放军理工大学
西安通信学院
中国人民解放军
-
出处
《自动化学报》
EI
CSCD
北大核心
2017年第2期248-258,共11页
-
基金
国家自然科学基金(61471394
61402519)
+1 种基金
江苏省自然科学基金(BK20140071
BK20140074)资助~~
-
文摘
本文将心理声学掩蔽特性应用于基于深度神经网络(Deep neural network,DNN)的单通道语音增强任务中,提出了一种具有感知掩蔽特性的DNN结构.首先,提出的DNN对带噪语音幅度谱特征进行训练并分别得到纯净语音和噪声的幅度谱估计.其次,利用估计的纯净语音幅度谱计算噪声掩蔽阈值.然后,将噪声掩蔽阈值和估计的噪声幅度谱联合计算得到一个感知增益函数.最后,利用感知增益函数从带噪语音幅度谱中估计出增强语音幅度谱.在TIMIT数据库上,对不同信噪比下的20种噪声进行的仿真实验表明,无论噪声类型是否在语音的训练集中出现,所提出的感知掩蔽DNN都能够在有效去除噪声的同时保持较小的语音失真,增强效果明显优于常见的DNN增强方法以及NMF(Nonnegative matrix factorization)增强方法.
-
关键词
语音增强
深度神经网络
感知增益函数
掩蔽阈值
-
Keywords
Speech enhancement, deep neural network, perceptual gain function, masking threshold
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
TN912.35
[电子电信—通信与信息系统]
-