期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
EMOTIONAL SPEECH RECOGNITION BASED ON SVM WITH GMM SUPERVECTOR 被引量:1
1
作者 Chen Yanxiang Xie Jian 《Journal of Electronics(China)》 2012年第3期339-344,共6页
Emotion recognition from speech is an important field of research in human computer interaction. In this letter the framework of Support Vector Machines (SVM) with Gaussian Mixture Model (GMM) supervector is introduce... Emotion recognition from speech is an important field of research in human computer interaction. In this letter the framework of Support Vector Machines (SVM) with Gaussian Mixture Model (GMM) supervector is introduced for emotional speech recognition. Because of the importance of variance in reflecting the distribution of speech, the normalized mean vectors potential to exploit the information from the variance are adopted to form the GMM supervector. Comparative experiments from five aspects are conducted to study their corresponding effect to system performance. The experiment results, which indicate that the influence of number of mixtures is strong as well as influence of duration is weak, provide basis for the train set selection of Universal Background Model (UBM). 展开更多
关键词 Emotional speech recognition Support Vector Machines (SVM) Gaussian Mixture Model (gmm) supervector Universal Background Model (USB)
下载PDF
PCA变换下的GMM-SVM话者确认研究 被引量:1
2
作者 卓著 李辉 《小型微型计算机系统》 CSCD 北大核心 2015年第3期637-640,共4页
针对支持向量机(SVM)输入参数不能充分利用高斯混合模型(GMM)均值、方差、权重所携带的说话人信息,而导致与文本无关话者确认系统性能下降的问题,本文结合GMM的均值、方差、权重,提出一种新的、基于自适应后GMM的,SVM模型输入特征提取... 针对支持向量机(SVM)输入参数不能充分利用高斯混合模型(GMM)均值、方差、权重所携带的说话人信息,而导致与文本无关话者确认系统性能下降的问题,本文结合GMM的均值、方差、权重,提出一种新的、基于自适应后GMM的,SVM模型输入特征提取方法。在NIST 06语音数据库上的实验表明,本方法将等误识率(EER)从高斯混合模型-通用背景模型(GMMUBM)系统的8.49%,下降到基于离散余弦变换(DCT)变换GMM-SVM系统的4.16%,以及基于主元成分分析(PCA)GMMSVM系统的3.3%. 展开更多
关键词 主元成分分析 gmm超矢量 支持向量机 话者确认
下载PDF
基于GMM超向量核函数的说话人识别
3
作者 胡若华 张有根 《微计算机信息》 2009年第7期254-256,共3页
针对现有说话人识别系统识别率不高,鲁棒性能差的缺点,提出了一种基于超向量的核函数构造方法。通过对超向量进行KL散度变换和L2线性内积变换,分别得到KL散度线性核函数、KL散度非线性核函数以及L2内积核函数。实验结果表明,将这三种核... 针对现有说话人识别系统识别率不高,鲁棒性能差的缺点,提出了一种基于超向量的核函数构造方法。通过对超向量进行KL散度变换和L2线性内积变换,分别得到KL散度线性核函数、KL散度非线性核函数以及L2内积核函数。实验结果表明,将这三种核函数分别应用于支持向量机的说话人识别系统,可以得到优于常规核函数的识别性能。 展开更多
关键词 说话人识别 KL散度 gmm超向量 L^2内积核函数 核函数
下载PDF
采用主成分分析的特征映射 被引量:8
4
作者 郭武 戴礼荣 王仁华 《自动化学报》 EI CSCD 北大核心 2008年第8期876-879,共4页
在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数... 在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数据,但是在特征映射时不需要对信道进行判决.在NIST 2006年SRE lconv4w-lconv4w数据库上,采用本文推荐方法的系统相对基线系统在等错误率上降低了19%. 展开更多
关键词 说话人确认 混合高斯模型 超矢量 梅尔刻度式倒谱参数
下载PDF
NAP序列核函数在话者识别中的应用 被引量:2
5
作者 邢玉娟 李明 《计算机工程》 CAS CSCD 北大核心 2010年第8期194-196,共3页
针对话者识别系统中特征向量不定长和交叉信道干扰等问题,提出一种基于超向量的扰动属性投影(NAP)核函数。该函数是一种新型的序列核函数,使支持向量机能在整体语音序列上分类,移除核函数空间中与话者识别无关的信道子空间信息。仿真实... 针对话者识别系统中特征向量不定长和交叉信道干扰等问题,提出一种基于超向量的扰动属性投影(NAP)核函数。该函数是一种新型的序列核函数,使支持向量机能在整体语音序列上分类,移除核函数空间中与话者识别无关的信道子空间信息。仿真实验结果表明,该函数可有效提高支持向量机的分类性能和话者识别系统的识别准确率。 展开更多
关键词 扰动属性投影 高斯混合模型超向量 话者识别 支持向量机
下载PDF
一种三层判决的说话人索引算法 被引量:1
6
作者 陈雪芳 杨继臣 《计算机工程》 CAS CSCD 2012年第2期184-185,共2页
为提高说话人索引准确率,提出一种三层判决的说话人索引算法。第1层使用惩罚距离公式对说话人改变进行检测,第2层采用说话人模型自举法进行初次说话人辨认,第3层采用GMM说话人超级矢量进行判决,解决说话人模型自举法中产生的数据不匹配... 为提高说话人索引准确率,提出一种三层判决的说话人索引算法。第1层使用惩罚距离公式对说话人改变进行检测,第2层采用说话人模型自举法进行初次说话人辨认,第3层采用GMM说话人超级矢量进行判决,解决说话人模型自举法中产生的数据不匹配问题。实验结果表明,采用惩罚距离公式,与贝叶斯信息判决方法相比不需调整参数,与DISTBIC方法相比F1值提高2%,使用GMM说话人超级矢量,在说话人索引准确率和数量准确率方面分别提高8.95%、18.25%。 展开更多
关键词 三层判决 说话人索引 惩罚距离 模型自举法 gmm说话人超级矢量
下载PDF
基于韵律特征的SVM说话人确认 被引量:2
7
作者 黄肖忠 李辉 +1 位作者 许东星 郭伟 《计算机工程与应用》 CSCD 北大核心 2011年第15期148-151,224,共5页
提出了一种基于韵律特征和SVM的文本无关说话人确认系统。采用小波分析方法,从语音信号的MFCC、F0和能量轨迹中提取出超音段韵律特征,通过实验研究三者的韵律特征在特征层的最佳互补融合,得到信号的韵律特征PMFCCFE,用韵律特征的GMM均... 提出了一种基于韵律特征和SVM的文本无关说话人确认系统。采用小波分析方法,从语音信号的MFCC、F0和能量轨迹中提取出超音段韵律特征,通过实验研究三者的韵律特征在特征层的最佳互补融合,得到信号的韵律特征PMFCCFE,用韵律特征的GMM均值超矢量作为参数训练目标话者的SVM模型,以更有效地区分目标话者和冒认话者。在NIST068side-1side数据库的实验表明,以短时倒谱参数的GMM-UBM系统为基准,超音段韵律特征的GMM-SVM系统的EER相对下降了57.9,MinDCF相对下降了41.4。 展开更多
关键词 韵律特征 高斯混合模型(gmm)超矢量 支持向量机 文本无关说话人确认
下载PDF
基于稀疏表征的话者识别 被引量:2
8
作者 吕小听 李昕 +1 位作者 屈燕琴 胡晨 《计算机工程与应用》 CSCD 2014年第20期215-217,243,共4页
近年来,随着信号的稀疏性理论越来越受到人们的关注,稀疏表征分类器也作为一种新型的分类算法被应用到话者识别系统中。该模型的基本思想是:只要超完备字典足够大,任意待测样本都能够用超完备字典进行线性表示。基于信号的稀疏性理论,... 近年来,随着信号的稀疏性理论越来越受到人们的关注,稀疏表征分类器也作为一种新型的分类算法被应用到话者识别系统中。该模型的基本思想是:只要超完备字典足够大,任意待测样本都能够用超完备字典进行线性表示。基于信号的稀疏性理论,未知话者的向量系数,即稀疏解可以通过L1范数最小化获取。超完备字典则可视为语音特征向量在高斯混合模型-通用背景模型(GMM-UBM)上进行MAP自适应而得到的大型数据库。采用稀疏表征模型作为话者辨认的分类方法,基于TIMIT语料库的实验结果表明,所采用的话者辨认方法,能够大大提高说话人识别系统的性能。 展开更多
关键词 稀疏表征 高斯混合模型(gmm)均值超向量 超完备字典 最大后验(MAP)算法
下载PDF
基于UCR训练集重构的真实语音情感识别
9
作者 戴明洋 杨大利 徐明星 《北京信息科技大学学报(自然科学版)》 2012年第2期63-67,共5页
真实语音情感识别是使人机交互更加友好的重要手段,但是训练数据稀缺为这一领域带来很多挑战。为了减小这一阻碍,提出了语句串接与重采样(UCR)方法,以便高效利用存在的训练数据。UCR方法是将原始音频样本按照情感类型进行串接,形成一个... 真实语音情感识别是使人机交互更加友好的重要手段,但是训练数据稀缺为这一领域带来很多挑战。为了减小这一阻碍,提出了语句串接与重采样(UCR)方法,以便高效利用存在的训练数据。UCR方法是将原始音频样本按照情感类型进行串接,形成一个长的音频流,以一个固定粒度对其随机乱序,然后将其切割,并通过多次重采样操作来增加支持向量机(SVM)的训练样本数。实验基于一个从访谈节目中录制的真实语音情感库。实验结果表明,在统一背景模型-高斯混合模型-支持向量机(UBM—GMM—SVM)识别框架中这种训练集重构的方法错误率降低近33.10%。 展开更多
关键词 语音情感识别 高斯混合模型超向量 UBM-gmm-SVM
下载PDF
序列核支持向量机系统的广义性分析
10
作者 魏宇 史正伟 李鉴 《南阳理工学院学报》 2012年第4期14-17,共4页
在文本无关的说话人识别系统中,采用序列核作为核函数的支持向量机系统已经得到了广泛的应用。本文首先归纳出构造序列核的通用框架,并在此框架之上对高斯序列核和广义线性区分核两种目前运用比较成熟的序列核系统进行分析比较,说明特... 在文本无关的说话人识别系统中,采用序列核作为核函数的支持向量机系统已经得到了广泛的应用。本文首先归纳出构造序列核的通用框架,并在此框架之上对高斯序列核和广义线性区分核两种目前运用比较成熟的序列核系统进行分析比较,说明特征空间中不同属性和层次的语音特征是如何通过不同的序列核来表征的。在NIST2006评测数据集中,识别率较传统的混合高斯模型-通用背景模型有显著提高。 展开更多
关键词 序列核 高斯超向量核 广义线性区分核 说话人识别
下载PDF
语音分段在基于GMM-SVM说话人确认中的应用 被引量:1
11
作者 饶为 王典洪 麦文伟 《电子技术(上海)》 2010年第3期18-19,共2页
在说话人确认系统的实际应用中,让用户提供大量的训练语音是不现实的,所以在GMM-SVM系统中,正样本点数通常只有一个,而负样本点数远远多于正样本点数,造成SVM分类超平面严重偏向负样本,这种情况对于支持向量机的性能影响很大。针对此问... 在说话人确认系统的实际应用中,让用户提供大量的训练语音是不现实的,所以在GMM-SVM系统中,正样本点数通常只有一个,而负样本点数远远多于正样本点数,造成SVM分类超平面严重偏向负样本,这种情况对于支持向量机的性能影响很大。针对此问题,提出了基于时间间隔对语音数据进行分段的方法,来增多正样本点数,得到更好的分类超平面。美国国家标准与技术研究所(NIST)2002年说话人识别数据库上的实验证明,语音分段的方法能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性。 展开更多
关键词 语音分段 gmm超向量 支持向量机 通用背景模型 说话人确认
原文传递
采用UBM更新量作为支持向量机特征的说话人确认 被引量:4
12
作者 郭武 戴礼荣 王仁华 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期704-707,共4页
在采用支持向量机的文本无关的说话人确认中,针对传统的均值超向量特征区分性不够明显的情况,该文提出采用相对背景模型的权重更新量以及均值更新量形成超向量,用这个超向量作为支持向量机的特征函数,在线性核函数的情况下,能够取得优... 在采用支持向量机的文本无关的说话人确认中,针对传统的均值超向量特征区分性不够明显的情况,该文提出采用相对背景模型的权重更新量以及均值更新量形成超向量,用这个超向量作为支持向量机的特征函数,在线性核函数的情况下,能够取得优于均值超向量和传统的Gauss混合模型-通用背景模型(GMM-UBM)的方法。在2006年美国国家标准与技术研究所说话者识别(NIST SRE)1conv4w-1conv4w数据库上,该方法相对于基线的GMM-UBM系统等错误率降低了22%。实验结果表明:权重参数在支持向量机中具有重要的作用,在不考虑与UBM的耦合性的情况下超向量能够取得更强的分类能力。 展开更多
关键词 说话人确认 混合Gauss模型 超向量
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部