-
题名有效频带多分辨率特征提取及说话人年龄识别
被引量:4
- 1
-
-
作者
杜先娜
俞一彪
-
机构
苏州大学电子信息学院
-
出处
《信号处理》
CSCD
北大核心
2016年第9期1101-1107,共7页
-
文摘
针对文本无关非特定说话人年龄识别,本文提出了一种基于有效频带多分辨率特征的统计分析识别方法。输入语音,通过小波包变换进行有效频带分解,然后将各有效频带的小波包系数连接构成一个整体计算美尔频率倒谱系数,得到有效频带多分辨率特征参数WPMFC(Wavelet Packet Mel-Frequency Cepstrum),说话人按年龄划分为儿童、青年、中年和老年四个阶段,并进一步按性别训练各年龄段语音得到8个高斯混合模型。测试语音依据最大似然准则进行识别判决。实验对本文提出的方法与传统的短时谱统计分析方法进行了比较,结果显示本文提出的方法有较好的识别性能,集内平均识别率达到65.17%。同时,实验结果也说明相对语音文本变化的影响,不同说话人发音特征的变化对识别性能的影响更大。
-
关键词
说话人年龄识别
有效频带
多分辨率特征
小波包变换
-
Keywords
speaker age recognition
effective frequency bands
multi-resolution features
wavelet packet transform
-
分类号
TN912.34
[电子电信—通信与信息系统]
-