基于掩码迭代估计的多通道语音识别算法

An Iterative Mask Estimation Approach Based Multi-Channel Speech Recognition

下载PDF

导出

摘要提出一种基于多通道语音识别的用于波束形成的闭环掩码迭代估计算法,通过神经网络迭代和语音识别获得理想比例掩码估计和语音活动检测信息。结合输入特性数据和输出得分数据,在CHiME-4六通道语音识别实测数据上该算法优于基于复高斯混合模型算法,字识别错误率指标下降了24.1%。 We propose a closed-loop approach to beamforming by leveraging upon information obtained from iterative neural network based ideal ratio mask estimation and speech recognition based voice activity detection. Testing on the CHIME-4 task of recognizing 6-channel microphone array speech, together with data augmentation for fusion of input features and of output scores, the proposed multi-channel approach significantly outperforms the CGMM-based method, yielded about 24. 1% word error relative reduction.

作者王智国黄磊王海坤

机构地区科大讯飞股份有限公司

出处《信息技术与标准化》 2018年第8期65-69,72,共6页 Information Technology & Standardization

关键词 CHiME-4挑战赛深度学习理想比例掩码麦克风阵列语音识别 CHIME-4 challenge deep learning ideal ratio mask microphone array speech recognition

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

1《自然》预测：2018年嫦娥四号任务榜上有名[J].绿洲农业科学与工程,2017,3(3):62-62.
2蒋孟格.Chime-long Holiday World:Children’s Paradise[J].阅读,2018(44):4-7.
3方伯梁(译),钱素云(校).《PEDIATRIC CRITICAL CARE MEDICINE》主论文直通车[J].中国小儿急救医学,2015,22(6):382-382.
4闫广实,刘鑫.基于多模型的鲁棒软测量建模方法[J].黑龙江科技大学学报,2018,28(5):598-602.
5李永立,樊宁远,林亿民,吴冲.网络参与者见面概率的迭代估计方法[J].系统工程学报,2018,33(2):167-174.
6任秀丽,任霞丽.无线传感网中节点的协同过滤定位算法[J].计算机应用研究,2018,35(10):3065-3068. 被引量：2
7刘叶,吴晟,吴兴蛟,周海河,李英娜,刘英莉.蚁群BP神经网络实体解析匹配研究[J].软件导刊,2018,17(3):37-40. 被引量：2
8张誉馨,张建秋.一种对异常值鲁棒新颖的无格点谱估计方法[J].复旦学报（自然科学版）,2018,57(1):92-99.
9李新超,钟卫东,李栋,马双棚.一种SM4算法的双路径随机掩码方案[J].中国科技论文,2018,13(14):1578-1583. 被引量：1
10罗杰.自适应选择样本的稀疏表示人脸识别算法[J].信息与电脑,2018,30(18):104-106.

信息技术与标准化

2018年第8期

浏览历史

内容加载中请稍等...

基于掩码迭代估计的多通道语音识别算法

相关作者

相关机构

相关主题

浏览历史