期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于SDC特征和GMM-UBM模型的自动语种识别 被引量:14
1
作者 姜洪臣 郑榕 +1 位作者 张树武 徐波 《中文信息学报》 CSCD 北大核心 2007年第1期49-53,共5页
本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以... 本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以快速得到每个语种的模型。与传统的GMM方法相比,该方法的训练和识别的速度更快。该方法对OGI电话语音库中11个语种进行了测试,其10秒、30秒和45秒句子的最佳识别正确率分别为72.38%、82.62%和85.23%,识别速度约为0.03倍实时。 展开更多
关键词 计算机应用 中文信息处理 SDC特征 gmm-ubm模型 贝叶斯自适应 自动语种识别
下载PDF
非线性幂变换Gammachirp滤波器的鲁棒语音特征提取 被引量:2
2
作者 李聪 葛洪伟 《计算机科学与探索》 CSCD 北大核心 2019年第8期1351-1359,共9页
针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变换伽马啁啾频率倒谱系数(NPGFCC)的抗噪语音特征提取算法。相比PNCC,NPGFCC的不同之处在于其采用符合人耳听觉特性的归一化压缩Gam... 针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变换伽马啁啾频率倒谱系数(NPGFCC)的抗噪语音特征提取算法。相比PNCC,NPGFCC的不同之处在于其采用符合人耳听觉特性的归一化压缩Gammachirp滤波器组代替Gammatone滤波器组进行滤波,并在特征参数中融合了分段式非线性幂函数变换的方式。另外,算法中利用了均值方差归一化和时间序列滤波等技术的方法,进一步提高了其在噪声环境下的鲁棒性,并在改进的i-vector+PLDA模型下进行了测试。实验结果表明,相较于目前常用的一些说话人语音特征提取算法,在不同噪声和不同信噪比下,NPGFCC特征具有最佳抗噪性能,特别是在信噪比较低的情况下,与其他语音特征相比,NPGFCC特征具有更大的优势。 展开更多
关键词 特征提取 说话人识别 伽马啁啾滤波器 高斯混合模型-通用背景模型(gmm-ubm) 辨识向量(i-vector) 概率线性判别分析(PLDA)
下载PDF
基于特征相对贡献度对加权Mel倒谱的改进 被引量:4
3
作者 王家盛 郭其威 +1 位作者 吴松 马建敏 《声学技术》 CSCD 北大核心 2021年第3期408-414,共7页
在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universa... 在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)基线系统,研究了在无噪环境中各维特征组合下的识别率,利用增减分量法定量计算出各维特征分量对识别率的相对贡献程度,并根据贡献度的强弱对各维特征分量进行合理加权,得到了贡献度拟合权重系数,将此系数用于改进梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征参数。仿真结果表明,对特征参数进行贡献度拟合权重系数加权后,声纹识别的正确率得到了提升。 展开更多
关键词 增减分量法 贡献度 梅尔(Mel)倒谱系数 高斯混合-通用背景模型(gmm-ubm)
下载PDF
GMM-UBM和SVM说话人辨认系统及融合的分析 被引量:9
4
作者 鲍焕军 郑方 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期693-698,共6页
在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在... 在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够。该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能。在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30%和SVM系统的8.26%降低到7.34%,分别相对降低了21.08%和11.14%。 展开更多
关键词 说话人辨认 Gauss混合模型-通用背景模型(gmm-ubm) 支持向量机(SVM) 信道鲁棒
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部