-
题名基于自编码特征的语音增强声学特征提取
被引量:7
- 1
-
-
作者
张涛
任相赢
刘阳
耿彦章
-
机构
天津大学电气自动化与信息工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2019年第8期1341-1350,共10页
-
基金
天津市科技计划项目No.16YFZCGX00760~~
-
文摘
利用监督性学习算法进行语音增强时,特征提取是至关重要的步骤。现有的组合特征和多分辨率特征等听觉特征是常用的声学特征,基于这些特征的增强语音虽然可懂度得到了较大提升,但是仍然残留大量噪声,语音质量(用信噪比衡量)很低。在不影响可懂度的情况下,为了提高语音增强后语音质量,提出了一种基于自编码特征的综合特征。首先利用自编码器提取自编码特征,然后利用GroupLasso算法验证自编码特征与听觉特征的互补性和冗余性,将特征重新组合得到综合特征,最后将综合特征作为语音增强系统的输入特征进行语音增强。在TIMIT语料库和Noisex-92噪声库上进行了仿真实验,结果表明,与传统的语音增强方法以及现有的组合特征和多分辨率特征分别作为语音增强系统输入特征的深度学习等方法相比,提出的增强算法的语音质量得到了较大提升。
-
关键词
自编码特征
深度神经网络
特征提取
信噪比
-
Keywords
auto-encoder feature
deep neural network
feature extraction
signal noise ratio (SNR)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于长时信号功率谱变化的语音端点检测
被引量:3
- 2
-
-
作者
张涛
刘阳
任相赢
-
机构
天津大学电气自动化与信息工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2019年第9期1534-1542,共9页
-
基金
天津市科技计划项目~~
-
文摘
语音端点检测是语音信号处理的基础,为了提高在低信噪比及非平稳噪声下语音端点检测的准确性,提出了一种基于长时信号功率谱变化的语音特征,利用阈值判决法验证了这一特征在语音端点检测中的应用前景。该方法首先统计信号在长时段下功率谱的变化量;然后进行阈值判决,在初始化后可依据每次的判决结果自适应更新阈值;最后通过投票决策机制来判定当前是否为语音帧。仿真结果表明,与两种经典的基于长时特征(长时段信号变化率和长时段信号谱平坦度)的语音端点检测方法相比,所提方法在不同噪声环境及信噪比下,均具有更高的检测准确率,尤其在非平稳噪声条件下的检测效果提升明显,例如在机枪噪声环境下,平均检测准确率提高超过10%。
-
关键词
语音端点检测
长时信号频谱变化
低信噪比
非平稳噪声
-
Keywords
voice activity detection
long-term power spectrum variability (LPSV)
low signal-to-noise ratio
nonstationary noise
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-