期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于改进MFCC和能量算子倒谱的语种识别
1
作者 陈思竹 龙华 邵玉斌 《计算机科学》 CSCD 北大核心 2024年第S02期367-372,共6页
针对广播语音信号低信噪比下语种识别准确率低和鲁棒性差的问题,提出了基于小波包变换改进MFCC和能量算子倒谱特征的语种识别算法。首先,采用小波包变换代替MFCC中的傅里叶变换和Mel滤波得到WMFCC特征参数。在保留人耳听觉感知特性的基... 针对广播语音信号低信噪比下语种识别准确率低和鲁棒性差的问题,提出了基于小波包变换改进MFCC和能量算子倒谱特征的语种识别算法。首先,采用小波包变换代替MFCC中的傅里叶变换和Mel滤波得到WMFCC特征参数。在保留人耳听觉感知特性的基础上提升语音信号的高频分析能力和分析精确度,克服傅里叶变换的局限性。其次,提取Teager能量算子倒谱,得到语音瞬时能量的特性,与改进的MFCC特征参数融合得到新的特征参数TWMFCC。最后,为进一步提升低信噪比语音的识别效果,提出了VMD自适应维纳滤波去噪算法。通过实验对比了所提特征与传统特征的识别效果,所提特征的平均识别准确率显著提升,带噪语音在未进行语音去噪处理的情况下较传统MFCC高13.02%,有效改善了传统特征在低信噪比下识别准确率低的问题,具有较强的抗噪性和鲁棒性。 展开更多
关键词 语种识别 MFCC 小波包变换 能量算子倒谱 GMM-UBM
下载PDF
基于GFCC和能量算子倒谱的语种识别 被引量:4
2
作者 刘晶 邵玉斌 +1 位作者 龙华 李一民 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期254-261,共8页
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,... 为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过高斯混合通用背景模型进行语种识别验证.实验结果表明,在信噪比为-5~0 dB时,相对于基于对数梅尔尺度滤波器组能量特征方法,融合特征集方法对5种语言的识别率,分别提升了23.7%~34.0%,其他信噪比等级下识别率也有明显的提升. 展开更多
关键词 语种识别 伽玛通频率系数 有声无声段检测 Teager能量算子倒谱参数 主成分分析
下载PDF
融合CFCC和Teager能量算子倒谱参数的语音识别 被引量:9
3
作者 史燕燕 白静 《计算机科学》 CSCD 北大核心 2019年第5期286-289,共4页
针对现有表征语音特性的特征提取不完善的问题,提出了一种耳蜗滤波倒谱系数(Cochlear Filter Cepstral Coefficients,CFCC)和Teager能量算子倒谱参数(Teager Energy Operators Cepstral Coefficients,TEOCC)相互融合的方法。该方法将表... 针对现有表征语音特性的特征提取不完善的问题,提出了一种耳蜗滤波倒谱系数(Cochlear Filter Cepstral Coefficients,CFCC)和Teager能量算子倒谱参数(Teager Energy Operators Cepstral Coefficients,TEOCC)相互融合的方法。该方法将表征人耳听觉特性的CFCC和体现非线性能量特性的TEOCC的融合特征应用到语音识别系统中,并联合主成分分析(Principal Components Analysis,PCA)对该融合特征进行特征选择和优化,最后通过支持向量机进行语音识别。实验结果表明:该融合特征与单一特征相比具有更佳的语音识别性能,结合PCA后其语音识别的准确率平均提高了3.7%。 展开更多
关键词 耳蜗滤波系数 Teager能量算子倒谱参数 主成分分析 语音识别
下载PDF
基于声道频谱参数的语种识别 被引量:11
4
作者 邵玉斌 刘晶 +2 位作者 龙华 杜庆治 李一民 《北京邮电大学学报》 EI CAS CSCD 北大核心 2021年第3期112-119,共8页
针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,... 针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,再基于信号频谱提取声道冲激响应频谱参数,然后融合Teager能量算子倒谱参数,最后通过高斯混合通用背景模型进行语种识别验证.不同信噪比条件下性能测试表明,所提方法相对于基于单一的梅尔频率倒谱系数特征、单一的伽玛通频率倒谱系数特征和基于对数梅尔尺度滤波器组能量特征,在低信噪比下提升约15 dB,显著提高了识别正确率. 展开更多
关键词 语种识别 声道冲激响应频参数 低通滤波 重采样 Teager能量算子倒谱参数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部