期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于UCR训练集重构的真实语音情感识别
1
作者 戴明洋 杨大利 徐明星 《北京信息科技大学学报(自然科学版)》 2012年第2期63-67,共5页
真实语音情感识别是使人机交互更加友好的重要手段,但是训练数据稀缺为这一领域带来很多挑战。为了减小这一阻碍,提出了语句串接与重采样(UCR)方法,以便高效利用存在的训练数据。UCR方法是将原始音频样本按照情感类型进行串接,形成一个... 真实语音情感识别是使人机交互更加友好的重要手段,但是训练数据稀缺为这一领域带来很多挑战。为了减小这一阻碍,提出了语句串接与重采样(UCR)方法,以便高效利用存在的训练数据。UCR方法是将原始音频样本按照情感类型进行串接,形成一个长的音频流,以一个固定粒度对其随机乱序,然后将其切割,并通过多次重采样操作来增加支持向量机(SVM)的训练样本数。实验基于一个从访谈节目中录制的真实语音情感库。实验结果表明,在统一背景模型-高斯混合模型-支持向量机(UBM—GMM—SVM)识别框架中这种训练集重构的方法错误率降低近33.10%。 展开更多
关键词 语音情感识别 高斯混合模型超向量 ubm-gmm-svm
下载PDF
组合核函数SVM在说话人识别中的应用 被引量:3
2
作者 吕洪艳 刘芳 《计算机系统应用》 2016年第5期168-172,共5页
针对说话人识别实际应用中训练数据不足的问题,选取GMM-UBM作为基准系统模型,用Eigen Voice对其作自适应,应用泛化能力较强的多项式核函数和学习能力较强的径向基核函数进行线性加权组合后的组合核函数进行模型参数优化,并用多重网格搜... 针对说话人识别实际应用中训练数据不足的问题,选取GMM-UBM作为基准系统模型,用Eigen Voice对其作自适应,应用泛化能力较强的多项式核函数和学习能力较强的径向基核函数进行线性加权组合后的组合核函数进行模型参数优化,并用多重网格搜索法确定核函数的最优参数,采用DAG方法实现SVM核函数的多元分类.在仿真实验中评估了线性核、多项式核、径向基核以及组合核函数,实验结果表明,在采用正确的参数前提下,在不同的多分类策略、自适应时间、信噪比和不同的说话人数量的情况下,组合核函数的识别性能明显都优于其它三个单核函数. 展开更多
关键词 说话人识别 组合核函数 SVM GMM-UBM
下载PDF
GMM-UBM和SVM在说话人识别中的应用 被引量:7
3
作者 李荟 赵云敏 《计算机系统应用》 2018年第1期225-230,共6页
针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题.选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较... 针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题.选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较强、学习能力较差与径向基核函数学习能力较强、泛化能力较差的特性,对两种单核核函数进行线性加权组合,以使组合核函数兼具各单核的优点.仿真实验结果表明,组合核函数SVM的识别率和等错误率明显优于不引入SVM的GMM-UBM的基线系统及其它三个单核函数,并在不同信噪比情况下也兼顾了系统识别准确率与鲁棒性. 展开更多
关键词 说话人识别 GMM-UBM SVM 组合核函数
下载PDF
基于GMM-UBM/SVM的维吾尔语电话语音监控系统 被引量:2
4
作者 李晓阳 伊.达瓦 +1 位作者 吾守尔.斯拉木 勾坂芳典 《计算机应用与软件》 CSCD 北大核心 2012年第1期46-48,77,共4页
讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设... 讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。 展开更多
关键词 电话语音监控 说话人识别 维吾尔语 GMM-UBM SVM
下载PDF
语音技术在少数民族语言的应用研究 被引量:3
5
作者 达瓦.伊德木草 木合亚提.尼亚孜别克 吾守尔.斯拉木 《新疆大学学报(自然科学版)》 CAS 2014年第1期88-96,共9页
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声... 本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM–UBM–SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM–UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%. 展开更多
关键词 语音技术 民语 说话人识别 连续语音识别 语音翻译
下载PDF
GMM-UBM和SVM说话人辨认系统及融合的分析 被引量:9
6
作者 鲍焕军 郑方 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期693-698,共6页
在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在... 在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够。该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能。在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30%和SVM系统的8.26%降低到7.34%,分别相对降低了21.08%和11.14%。 展开更多
关键词 说话人辨认 Gauss混合模型-通用背景模型(GMM-UBM) 支持向量机(SVM) 信道鲁棒
原文传递
语音分段在基于GMM-SVM说话人确认中的应用 被引量:1
7
作者 饶为 王典洪 麦文伟 《电子技术(上海)》 2010年第3期18-19,共2页
在说话人确认系统的实际应用中,让用户提供大量的训练语音是不现实的,所以在GMM-SVM系统中,正样本点数通常只有一个,而负样本点数远远多于正样本点数,造成SVM分类超平面严重偏向负样本,这种情况对于支持向量机的性能影响很大。针对此问... 在说话人确认系统的实际应用中,让用户提供大量的训练语音是不现实的,所以在GMM-SVM系统中,正样本点数通常只有一个,而负样本点数远远多于正样本点数,造成SVM分类超平面严重偏向负样本,这种情况对于支持向量机的性能影响很大。针对此问题,提出了基于时间间隔对语音数据进行分段的方法,来增多正样本点数,得到更好的分类超平面。美国国家标准与技术研究所(NIST)2002年说话人识别数据库上的实验证明,语音分段的方法能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性。 展开更多
关键词 语音分段 GMM超向量 支持向量机 通用背景模型 说话人确认
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部