针对数字语音信号分帧提取MFCC参数,MFCC是Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)。Mel频率是基于人耳听觉特性提出的,它与Hz频率呈非线性对应关系,利用它们之间的这种关系,计算得到Hz频谱特征。将每帧的MFCC作为...针对数字语音信号分帧提取MFCC参数,MFCC是Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)。Mel频率是基于人耳听觉特性提出的,它与Hz频率呈非线性对应关系,利用它们之间的这种关系,计算得到Hz频谱特征。将每帧的MFCC作为矢量进行自组织特征映射神经网络矢量量化及LBG矢量量化,通过实验对二者进行比较。仿真结果表明,自组织特征映射神经网络矢量量化算法得到的码书比LBG算法具有量化误差小、码本尺寸小的特点,进而可以节省存储空间。实验结果表明,文中方法具有一定的实用性。展开更多
基金Supported by the National Natural Science Foundation of China under Grant No.60773061the Jiangsu Ph.D.Students Innovative Foundation of China under Grant No.BCXJ05-05~~
文摘针对数字语音信号分帧提取MFCC参数,MFCC是Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)。Mel频率是基于人耳听觉特性提出的,它与Hz频率呈非线性对应关系,利用它们之间的这种关系,计算得到Hz频谱特征。将每帧的MFCC作为矢量进行自组织特征映射神经网络矢量量化及LBG矢量量化,通过实验对二者进行比较。仿真结果表明,自组织特征映射神经网络矢量量化算法得到的码书比LBG算法具有量化误差小、码本尺寸小的特点,进而可以节省存储空间。实验结果表明,文中方法具有一定的实用性。