维纳后置滤波DNN前端增强的远场语音识别

Wiener Post-Filter DNN Front-End Enhancement for Far-Field Speech Recognition

下载PDF

导出

摘要由于混响和噪声等因素影响,远距离场景下的语音识别性能较近场语音识别的性能仍有很大差距。为提高远场语音识别系统的性能,在后置滤波波束形成的基础上,提出结合深度神经网络与维纳后置滤波的前端增强远场语音识别方法。将维纳滤波嵌入神经网络对波束形成后的语音输出进行增强,抑制相关性噪声,最后利用TDNN-LSTM近场语音识别系统进行语音识别。实验在数据集CHiME-5上进行,结果表明,该方法对远场语音的识别结果优于传统的后置滤波方法,字错误率下降2.3%。 Because of the reverberation and background noise,there is still a gap between the far-field speech recognition and close-talk speech recognition.To improve the performance of far-field speech recognition,this paper proposes a deep neural network architecture combined with Wiener post-filer based on the post-filter beamforming.The speech is enhanced by method combining the neural networks and Wiener filter.TDNN-LSTM system is utilized to recognize the enhanced speech.The experiment is performed on the CHiME-5 dataset.The results show that the proposed method gains a 2.3%WER compared to the conventional method.

作者刘诚然宋潇潇屈丹杨绪魁 LIU Chengran;SONG Xiaoxiao;QU Dan;YANG Xukui(Information Engineering University, Zhengzhou 450001, China;Henan Information Center, Zhengzhou 450003, China)

机构地区信息工程大学河南省信息中心

出处《信息工程大学学报》 2019年第4期405-409,416,共6页 Journal of Information Engineering University

基金国家自然科学基金资助项目(61673395)。

关键词远场语音识别维纳后置滤波深度神经网络波束形成 far-field speech recognition Wiener post-filter deep neural networks beamforming

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1梁玉龙,屈丹,李真,张文林.基于卷积神经网络的维吾尔语语音识别[J].信息工程大学学报,2017,18(1):44-50. 被引量：11
2李华,屈丹,范正光,张文林.基于LSTM RNNLM的N-best重打分算法[J].信息工程大学学报,2017,18(4):419-425. 被引量：4

二级参考文献4

1那斯尔江.吐尔逊,吾守尔.斯拉木.基于隐马尔可夫模型的维吾尔语连续语音识别系统[J].计算机应用,2009,29(7):2009-2011. 被引量：17
2SI Yujing,LI Ta,PAN Jielin,YAN Yonghong.A Prefix Tree Based n-best List Re-scoring Strategy for Recurrent Neural Network Language Model[J].Chinese Journal of Electronics,2014,23(1):70-74. 被引量：3
3麦麦提艾力.吐尔逊,戴礼荣.深度神经网络在维吾尔语大词汇量连续语音识别中的应用[J].数据采集与处理,2015,30(2):365-371. 被引量：12
4其米克.巴特西,黄浩,王羡慧.基于深度神经网络的维吾尔语语音识别[J].计算机工程与设计,2015,36(8):2239-2244. 被引量：13

共引文献12

1梁玉龙,屈丹,邱泽宇.基于改进i-vector的说话人感知训练方法研究[J].计算机工程,2018,44(5):262-267.
2阿依先木.卡得尔,邱自成.维吾尔语三音素决策树的欠拟合调优[J].塔里木大学学报,2018,30(2):98-108.
3刘方园,王水花,张煜东.卷积神经网络架构及其应用的研究[J].新型工业化,2017,7(11):40-51. 被引量：12
4杨洋,汪毓铎.基于改进卷积神经网络算法的语音识别[J].应用声学,2018,37(6):940-946. 被引量：26
5杨鹤标,龚文彦.基于卷积神经网络的反向传播算法改进[J].计算机工程与设计,2019,40(1):126-130. 被引量：23
6刘江永,刘文翰,易灵芝.多时序协同中期负荷预测模型[J].电力系统及其自动化学报,2020,32(2):48-53. 被引量：14
7刘娟宏,胡彧,黄鹤宇.端到端的深度卷积神经网络语音识别[J].计算机应用与软件,2020,37(4):192-196. 被引量：31
8李响,张磊,刘媛媛.融合FAQ的任务型对话系统设计[J].信息工程大学学报,2019,20(4):473-479.
9刘佳文,屈丹,杨绪魁,张昊,唐君.基于Transformer的越南语连续语音识别[J].信息工程大学学报,2020,21(2):129-133. 被引量：2
10穆凯代姆罕·伊敏江,艾斯卡尔·艾木都拉,米吉提·阿不里米提.基于CNN-HMM和RNN的维吾尔语语音识别[J].现代电子技术,2021,44(11):172-176. 被引量：3

1吕超品,王玥,徐薇,成跃宇,曾彦鑫.基于RFID的定点识别语音介绍机器设备[J].计算机产品与流通,2019,0(11):124-124.
2周毅,宋柄兵,王臻,傅山.基于多特征融合的电网调度员工作负荷综合评价方法[J].微型电脑应用,2019,35(11):71-75. 被引量：5
3刘伟波,曾庆宁,卜玉婷,郑展恒.基于双微阵列与卷积神经网络的语音识别方法[J].计算机应用,2019,39(11):3268-3273. 被引量：13
4郑霞,侯振平,戴求仲,陈青,吴端钦.饲用苎麻与饲用玉米不同比例混合青贮的研究[J].中国农学通报,2019,35(33):137-140. 被引量：8
5洋芋,车酸酸,松鼠小金(绘).进城记[J].学苑创造（A版）,2020,0(1):38-39.
6陈佳欣,王大东,孙明辰,王晓宇.基于云平台的NAO机器人语音处理[J].佳木斯大学学报（自然科学版）,2019,37(6):912-916. 被引量：3
7倪峰,周翊,刘宏清.利用信号功率谱密度的麦克风阵列噪声消除方法[J].信号处理,2020,36(3):373-381. 被引量：3
8李泽文,任申,贺子凝,肖仁平,王杨帆.EMD分解结合维纳滤波的电压行波精确检测方法[J].电力系统及其自动化学报,2019,31(12):28-34. 被引量：6
9张严严,房文艳,许国辉,任宇鹏,许兴北.波浪作用下沉积物中氮、磷释放速率的试验研究[J].中国海洋大学学报（自然科学版）,2020,50(4):102-110. 被引量：3
10谢春梅,李想,何永美,祖艳群,李元.元阳梯田水稻秸秆饲用特征对增强的UV-B辐射的响应[J].云南农业大学学报（自然科学版）,2020,35(1):172-179. 被引量：4

信息工程大学学报

2019年第4期

浏览历史

内容加载中请稍等...

维纳后置滤波DNN前端增强的远场语音识别

参考文献2

二级参考文献4

共引文献12

相关作者

相关机构

相关主题

浏览历史