-
题名基于发声机理与人耳感知特性的说话人识别
被引量:3
- 1
-
-
作者
杜晓青
于凤芹
-
机构
江南大学物联网工程学院
-
出处
《计算机工程》
CAS
CSCD
2013年第11期197-199,204,共4页
-
基金
国家自然科学基金资助项目(61075008)
-
文摘
Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。
-
关键词
说话人识别
发声机理
人耳感知特性
希尔伯特黄变换倒谱系数
感知线性预测倒谱系数
RELATIVE
spectra滤波
-
Keywords
speaker recognition
vocal mechanism
human ear perceptual characteristic
Hilbert-Huang Transform(HHT) cepstrumcoefficient
perception linear prediction cepstrum coefficient
Re.lative spectra filtering
-
分类号
TN912.3
[电子电信—通信与信息系统]
-