-
题名基于广义回归神经网络的面罩语音矫正研究
被引量:3
- 1
-
-
作者
王霞
刘婕
王光艳
王蒙军
-
机构
河北工业大学电子信息工程学院
天津商业大学信息工程学院
-
出处
《现代电子技术》
北大核心
2017年第17期60-63,共4页
-
基金
天津市自然科学基金重点项目(14JCZDJC32600)
-
文摘
为了提高面罩语音的清晰度和可懂度,提出一种基于广义回归神经网络(GRNN)对线谱对(LSP)参数进行非线性建模的面罩语音矫正方法。分别提取正常语音和面罩语音的LSP参数,其次利用LSP参数对GRNN进行训练,得到矫正模型,将面罩语音的LSP参数通过矫正模型进行修正,并将结果作为参数用来合成新的语音。实验结果表明,利用GRNN训练出的矫正模型能够有效地调整面罩语音的LSP参数,在一定程度上能够恢复其频谱分布。
-
关键词
面罩语音
线谱对
广义回归神经网络
语音合成
-
Keywords
mask speech
LSP
GRNN
speech synthesis
-
分类号
TN912.3-34
[电子电信—通信与信息系统]
-
-
题名基于卷积神经网络的面罩语音识别
被引量:6
- 2
-
-
作者
王霞
杜桂明
王光艳
张艳
-
机构
河北工业大学电子信息工程学院
天津商业大学信息工程学院
-
出处
《传感器与微系统》
CSCD
2017年第10期31-34,37,共5页
-
基金
天津市自然科学基金重点资助项目(14JCZDJC32600)
-
文摘
针对带噪面罩语音识别率低的问题,结合语音增强算法,对面罩语音进行噪声抑制处理,提高信噪比,在语音增强中提出了一种改进的维纳滤波法,通过谱熵法检测有话帧和无话帧来更新噪声功率谱,同时引入参数控制增益函数;提取面罩语音信号的Mel频率倒谱系数(MFCC)作为特征参数;通过卷积神经网络(CNN)进行训练和识别,并在每个池化层后经局部响应归一化(LRN)进行优化。实验结果表明:该识别系统能够在很大程度上提高带噪面罩语音的识别率。
-
关键词
面罩语音识别
卷积神经网络
语音增强
维纳滤波法
-
Keywords
mask speech recognition
speech enhancement
Wiener filtering algorithm
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名压缩感知与EMD相结合的带噪面罩语音增强
被引量:1
- 3
-
-
作者
王霞
王丹
王光艳
张艳
-
机构
河北工业大学电子信息工程学院
天津商业大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第18期137-140,256,共5页
-
基金
天津市自然科学基金重点项目(No.14JCZDJC32600)
-
文摘
针对带噪面罩语音清晰度和可懂度低的问题,提出了一种将压缩感知和经验模式分解(Empirical Mode Decomposition,EMD)相结合的方法来对带噪面罩语音进行增强。首先对带噪面罩语音进行EMD分解得到其本征模式函数信号分量,对其特定本征模式分量进行小波阈值去噪;然后对全部信号分量进行压缩感知,最后重构信号分量得到增强后面罩语音。由实验结果可知,文中提出的方法去噪效果较好,重构误差较小,稳定性较高,有效地实现了面罩语音的增强。
-
关键词
带噪面罩语音增强
压缩感知
经验模式分解
小波阈值
-
Keywords
noisy mask speech enhancement
compressed sensing
Empirical Mode Decomposition(EMD)
wavelet threshold
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名面罩语音质量评价算法适用性研究
被引量:1
- 4
-
-
作者
王霞
马俊晖
王光艳
张艳
-
机构
河北工业大学电子信息工程学院
天津商业大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第19期114-117,156,共5页
-
基金
天津市自然科学基金重点项目(No.14JCZDJC32600)
-
文摘
针对语音编码的音质评价算法性能已十分明确,但对于面罩语音不一定适用。讨论了语音质量评价算法对空气语音与面罩语音在不同噪声环境下的适用性。采用主观意见得分和三种客观评价测度对多种信噪比的带噪语音和增强语音进行评价,包括分段信噪比、改进的巴克谱失真(MBSD)和语音感知质量评价(PESQ),根据与主观评价的一致性判断客观评价方法的适用性。增强算法采用维纳滤波法和对数谱最小均方误差法(LSA-MMSE),噪声采用粉红噪声、海浪噪声。仿真结果表明,语音质量评价算法的适用性与语音类型、信噪比、背景噪声、增强算法种类有关。粉红噪声环境下,PESQ不适合评价经维纳滤波增强的空气语音;MBSD算法只适用于评价经LSA-MMSE增强的面罩语音。海浪噪声环境下,PESQ适用于评价面罩语音,MBSD不适合评价面罩语音。
-
关键词
面罩语音
维纳滤波
改进巴克谱失真(MBSD)
语音感知质量评价(PESQ)
-
Keywords
face mask speech
Wiener filtering
Modified Bark Spectral Distortion(MBSD)
Perceptual Evaluation of Speech Quality(PESQ)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-