期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
基于特征融合与改进GMM-UBM的方言分析
1
作者 徐芝灿 刘本永 《通信技术》 2023年第4期419-424,共6页
针对单一特征在描述方言间差异性方面存在不足和传统高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)在训练时存在混叠的问题,在将经验模式分解引入到特征提取的基础上,融合多特征形成高维特征。进一... 针对单一特征在描述方言间差异性方面存在不足和传统高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)在训练时存在混叠的问题,在将经验模式分解引入到特征提取的基础上,融合多特征形成高维特征。进一步,通过多次训练GMMUBM,筛选出最具区分性的方言模型以提升各方言模型间的区分性。方言种类识别对比实验结果表明,基于融合特征与改进GMM-UBM的方法优于传统方法。 展开更多
关键词 改进gmm-ubm 特征融合 经验模式分解 方言种类识别
下载PDF
基于SDC特征和GMM-UBM模型的自动语种识别 被引量:14
2
作者 姜洪臣 郑榕 +1 位作者 张树武 徐波 《中文信息学报》 CSCD 北大核心 2007年第1期49-53,共5页
本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以... 本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以快速得到每个语种的模型。与传统的GMM方法相比,该方法的训练和识别的速度更快。该方法对OGI电话语音库中11个语种进行了测试,其10秒、30秒和45秒句子的最佳识别正确率分别为72.38%、82.62%和85.23%,识别速度约为0.03倍实时。 展开更多
关键词 计算机应用 中文信息处理 SDC特征 gmm-ubm模型 贝叶斯自适应 自动语种识别
下载PDF
GMM-UBM和SVM在说话人识别中的应用 被引量:7
3
作者 李荟 赵云敏 《计算机系统应用》 2018年第1期225-230,共6页
针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题.选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较... 针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题.选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较强、学习能力较差与径向基核函数学习能力较强、泛化能力较差的特性,对两种单核核函数进行线性加权组合,以使组合核函数兼具各单核的优点.仿真实验结果表明,组合核函数SVM的识别率和等错误率明显优于不引入SVM的GMM-UBM的基线系统及其它三个单核函数,并在不同信噪比情况下也兼顾了系统识别准确率与鲁棒性. 展开更多
关键词 说话人识别 gmm-ubm SVM 组合核函数
下载PDF
基于GMM-UBM说话人模型的连续自适应算法研究 被引量:2
4
作者 张正平 张丽娜 贺松 《通信电源技术》 2016年第2期81-83,共3页
实际应用中与文本无关的说话人识别研究,模型训练的说话人语音一般是有限的。此外,由于说话人自身生理因素的改变、外部采集环境的变化等都可能会导致说话人语音的声学特征发生改变。因此,代表说话人模型的特征分布也在不断变化,从而造... 实际应用中与文本无关的说话人识别研究,模型训练的说话人语音一般是有限的。此外,由于说话人自身生理因素的改变、外部采集环境的变化等都可能会导致说话人语音的声学特征发生改变。因此,代表说话人模型的特征分布也在不断变化,从而造成说话人识别系统识别率下降。文中在说话人自适应技术的基础上,提出了说话人模型的连续自适应算法,解决了因说话人自身声学特征的变化导致识别率下降的问题。 展开更多
关键词 说话人识别 gmm-ubm 最大后验概率 连续自适应
下载PDF
基于GMM-UBM的说话人确认系统的研究
5
作者 霍春宝 张彩娟 赵红敏 《辽宁工业大学学报(自然科学版)》 2012年第2期98-101,157,共4页
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数?,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者... 在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数?,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM-UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。 展开更多
关键词 说话人识别 高斯混合模型 EM算法 gmm-ubm
下载PDF
基于GMM-UBM的说话人确认系统的研究
6
作者 霍春宝 张彩娟 赵红敏 《辽宁工业大学学报(自然科学版)》 2012年第3期149-151,157,共4页
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在... 在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降.采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM—UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。 展开更多
关键词 说话人识别 高斯混合模型 EM算法 gmm-ubm
下载PDF
基于GMM-UBM的声纹识别技术的特征参数研究 被引量:16
7
作者 周玥媛 孔钦 《计算机技术与发展》 2020年第5期76-83,共8页
声纹识别技术实现的关键点在于从语音信号中提取语音特征参数,此参数具备表征说话人特征的能力。基于GMM-UBM模型,通过Matlab实现文本无关的声纹识别系统,对主流静态特征参数MFCC、LPCC、LPC以及结合动态参数的MFCC,从说话人确认与说话... 声纹识别技术实现的关键点在于从语音信号中提取语音特征参数,此参数具备表征说话人特征的能力。基于GMM-UBM模型,通过Matlab实现文本无关的声纹识别系统,对主流静态特征参数MFCC、LPCC、LPC以及结合动态参数的MFCC,从说话人确认与说话人辨认两种应用角度进行性能比较。在取不同特征参数阶数、不同高斯混合度和使用不同时长的训练语音与测试语音的情况下,从理论识别效果、实际识别效果、识别所用时长、识别时长占比等多个方面进行了分析与研究。最终结果表明:在GMM-UBM模式识别方法下,三种静态特征参数中MFCC绝大多数时候具有最佳识别效果,同时其系统识别耗时最长;识别率与语音特征参数的阶数之间并非单调上升关系。静态参数在结合较佳阶数的动态参数时能够提升识别效果;增加动态参数阶数与提高系统识别效果之间无必然联系。 展开更多
关键词 gmm-ubm 声纹识别 特征参数性能 说话人确认 说话人辨认
下载PDF
基于GMM-UBM/SVM的维吾尔语电话语音监控系统 被引量:2
8
作者 李晓阳 伊.达瓦 +1 位作者 吾守尔.斯拉木 勾坂芳典 《计算机应用与软件》 CSCD 北大核心 2012年第1期46-48,77,共4页
讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设... 讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。 展开更多
关键词 电话语音监控 说话人识别 维吾尔语 gmm-ubm SVM
下载PDF
一种改进的基于GMM-UBM的法庭自动说话人识别系统 被引量:4
9
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2013年第6期800-805,共6页
对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道... 对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道和移动手机信道的数据库进行了系统的测试. 展开更多
关键词 似然比 法庭自动说话人识别 高斯混合模型-通用背景模型
下载PDF
基于两种GMM-UBM多维概率输出的SVM语音情感识别 被引量:2
10
作者 黄永明 章国宝 +1 位作者 董飞 达飞鹏 《计算机应用研究》 CSCD 北大核心 2011年第1期98-101,共4页
针对GMM应用于情感识别时区分能力较弱的缺点,提出了一种将GMM与SVM有效结合的算法:基于GMM-UBM多维概率输出的SVM语音情感识别方法。该方法将GMM-UBM模型对一条语音的情感特征参数的两种多维概率输出(与特征向量同维、与GMM阶数同维)作... 针对GMM应用于情感识别时区分能力较弱的缺点,提出了一种将GMM与SVM有效结合的算法:基于GMM-UBM多维概率输出的SVM语音情感识别方法。该方法将GMM-UBM模型对一条语音的情感特征参数的两种多维概率输出(与特征向量同维、与GMM阶数同维)作为SVM分类器的特征参数,既利用了GMM表征数据本身统计特性的能力,又保留了SVM判决能力强的特点。在柏林情感语音库与汉语情感语料库上进行的实验结果表明,该方法在语音情感识别上的平均识别率较标准GMM方法提高1.7%~3.7%。 展开更多
关键词 语音情感识别 特征向量同维GMM—UBM多维概率输出 GMM阶数同维GMM—UBM多维概率输出 支持向量机(SVM)
下载PDF
基于CGMM-UBM的电话短语音说话人确认 被引量:2
11
作者 吴礼福 解焱陆 +1 位作者 戴蓓蒨 李辉 《电路与系统学报》 CSCD 北大核心 2007年第5期131-136,共6页
针对手机、电话的短语音文本无关说话人确认,本文设计了一种基于分类GMM-UBM(CGMM-UBM)的说话人确认系统。用k-means算法将训练背景模型的语音参数集分类成若干个子空间,并据此进行目标说话人语音数据的子空间分类,再采用GMM-UBM结构为... 针对手机、电话的短语音文本无关说话人确认,本文设计了一种基于分类GMM-UBM(CGMM-UBM)的说话人确认系统。用k-means算法将训练背景模型的语音参数集分类成若干个子空间,并据此进行目标说话人语音数据的子空间分类,再采用GMM-UBM结构为每个子空间分别建立一个子系统,以各个子系统输出评分的线性加权作为系统的输出评分。分类后的模型可以采用较低的混合度,线性加权增强了贡献较大子空间对确认性能的作用。在NIST’03语音库上100个男性话者的实验表明,短语音条件下,分类系统的性能比不分类系统有显著的改进,运算效率较后者也提高很多。 展开更多
关键词 电话语音 说话人确认 与文本无关 分类高斯混合模型-背景模型
下载PDF
基于超音段韵律特征和GMM-UBM的文本无关的说话人识别 被引量:1
12
作者 许东星 戴蓓蒨 +1 位作者 刘青松 许敏强 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第2期157-162,共6页
提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCC... 提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCCF0.在NIST068side-1side复杂背景电话手机语音数据库上的说话人确认实验则表明,采用一阶小波分析方法提取的超音段韵律参数PMFCC的识别性能与短时MFCC相当,采用超音段韵律特征PMFCCF0的系统确认性能比采用短时MFCC系统有较大的提高.在微软数据库进行不同信噪比测试语音的说话人辨认实验表明,PMFCCF0有比短时MFCC更好的噪声鲁棒性. 展开更多
关键词 超音段韵律特征 GMM—UBM 文本无关 说话人识别
下载PDF
GMM-UBM声纹识别技术研究与应用 被引量:3
13
作者 沈阳丽 赵启升 《电脑编程技巧与维护》 2017年第16期84-86,共3页
随着信息化技术发展,身份识别的方式逐步多样化,如人脸、指纹、声纹等,其中声纹识别因代价低、移动性好等优点而得到广泛关注。在研究VQ、HMM等传统声纹识别技术的基础上,提出了一种优秀算法GMM-UBM,并将其运用在考勤系统中。实验证明,... 随着信息化技术发展,身份识别的方式逐步多样化,如人脸、指纹、声纹等,其中声纹识别因代价低、移动性好等优点而得到广泛关注。在研究VQ、HMM等传统声纹识别技术的基础上,提出了一种优秀算法GMM-UBM,并将其运用在考勤系统中。实验证明,与传统算法相比,GMM-UBM在识别率和并发度方面具有一定的优越性。 展开更多
关键词 声纹识别 gmm-ubm技术 ANDROID系统 考勤系统
下载PDF
基于GMM-UBM的飞机发动机声音识别方法研究 被引量:2
14
作者 杨毫鸽 孙成立 《计算机科学与应用》 2017年第8期781-787,共7页
高斯混合模型–通用背景模型(Gaussian mixture model-universal background model, GMM-UBM)是说话人识别技术中最为常用的模型,该模型在诸多试验中都取得了很好的效果。本设计探索把GMM-UBM模型用在异常声音检测中,通过对飞机发动机... 高斯混合模型–通用背景模型(Gaussian mixture model-universal background model, GMM-UBM)是说话人识别技术中最为常用的模型,该模型在诸多试验中都取得了很好的效果。本设计探索把GMM-UBM模型用在异常声音检测中,通过对飞机发动机声音信号的处理,提取梅尔频率倒谱(MFCC)特征参数,训练UBM模型,用MAP自适应的算法得到GMM-UBM模型,用GMM-UBM模型检测识别发动机声音。实验证明,该方法优化了由于外界干扰变化导致的识别率下降的问题。 展开更多
关键词 说话人识别 gmm-ubm MFCC 异常声音检测 MAP
下载PDF
基于GMM-UBM的语言辨识算法研究
15
作者 陈业仙 张歆奕 毛杰 《五邑大学学报(自然科学版)》 CAS 2010年第3期56-60,共5页
运用Matlab软件,以自已建立的语音数据库为基础,对与文本无关的基于GMM-UBM的语言辨识系统进行了测试,获得的平均识别率达74%,与传统GMM算法的测试对比,基于GMM-UBM的语言辨识算法能更好地改善语言辨识系统的性能.
关键词 语言辨识 高斯混合-全局背景模型 期望最大化 贝叶斯自适应算法
下载PDF
基于子带GMM-UBM的广播语音多语种识别 被引量:2
16
作者 李思一 戴蓓蒨 王海祥 《数据采集与处理》 CSCD 北大核心 2007年第1期14-18,共5页
提出了一种基于概率统计模型的与语言内容无关的语种识别方法,它不需要掌握各语种的专业语言学知识就可以实现几十种语言的语种识别;并针对广播语音噪声干扰大的特点,采用GMM-UBM模型作为语种模型,提高了系统的噪声鲁棒性;由于广播语音... 提出了一种基于概率统计模型的与语言内容无关的语种识别方法,它不需要掌握各语种的专业语言学知识就可以实现几十种语言的语种识别;并针对广播语音噪声干扰大的特点,采用GMM-UBM模型作为语种模型,提高了系统的噪声鲁棒性;由于广播语音的背景噪声不是简单的全频带加性白噪声,因此本文构建了一种基于子带GMM-UBM模型的多子系统结构的语种识别系统,后端采用神经网络进行系统级融合。本文通过对37种语言及方言的识别实验,证明了子带GMM-UBM方法的有效性。 展开更多
关键词 语种识别 语言内容无关 广播语音 子带GMM—UBM
下载PDF
GMM-UBM和SVM说话人辨认系统及融合的分析 被引量:9
17
作者 鲍焕军 郑方 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期693-698,共6页
在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在... 在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够。该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能。在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30%和SVM系统的8.26%降低到7.34%,分别相对降低了21.08%和11.14%。 展开更多
关键词 说话人辨认 Gauss混合模型-通用背景模型(gmm-ubm) 支持向量机(SVM) 信道鲁棒
原文传递
基于GMM-UBM的说话人确认系统的研究 被引量:7
18
作者 张彩红 洪青阳 陈燕 《心智与计算》 2007年第4期420-425,共5页
高斯混合模型(Gaussian Mixture Model,GMM)已经广泛的应用于文本无关的声纹识别系统,本文详细介绍了一个把背景模型(Universal Background Model,UBM)应用到说话人建模中去的说话人确认系统。由于人的声音的生物特征多变性,说话人模型... 高斯混合模型(Gaussian Mixture Model,GMM)已经广泛的应用于文本无关的声纹识别系统,本文详细介绍了一个把背景模型(Universal Background Model,UBM)应用到说话人建模中去的说话人确认系统。由于人的声音的生物特征多变性,说话人模型还需要进行自适应技术的改进。最后,实验结果证明了采用自适应技术的GMM-UBM模型的高效性。 展开更多
关键词 说话人确认 高斯混合模型 背景模型 最大后验概率算法
原文传递
基于改进PNCC特征和两步区分性训练的录音设备识别方法 被引量:9
19
作者 贺前华 王志锋 +2 位作者 Alexander I Rudnicky 朱铮宇 李新超 《电子学报》 EI CAS CSCD 北大核心 2014年第1期191-198,共8页
录音设备来源识别是通过分析已获取的数字语音信号从而确定其录制设备的一种技术,属于数字音频盲取证.本文提出了一种基于改进PNCC特征和两步区分性训练的录音设备识别方法,由于音频中的静音包含了完整的设备信息,且不受说话人和文本等... 录音设备来源识别是通过分析已获取的数字语音信号从而确定其录制设备的一种技术,属于数字音频盲取证.本文提出了一种基于改进PNCC特征和两步区分性训练的录音设备识别方法,由于音频中的静音包含了完整的设备信息,且不受说话人和文本等因素的影响,因此从静音段提取改进的PNCC特征,利用了PNCC的长时帧分析去除背景噪声对设备信息的影响.在模型方面,以GMM-UBM为基准模型,并通过两步区分性训练调整集内设备模型和通用背景模型,提升模型区分能力.该方法对于30种设备闭集识别的平均正确识别率为90.23%;对于15个集内和15个集外设备的测试,等错误率为15.17%,集内平均正确识别率为96.65%,验证了本文算法的有效性. 展开更多
关键词 数字音频取证 录音设备识别 gmm-ubm 区分性训练 PNCC
下载PDF
组合核函数SVM在说话人识别中的应用 被引量:3
20
作者 吕洪艳 刘芳 《计算机系统应用》 2016年第5期168-172,共5页
针对说话人识别实际应用中训练数据不足的问题,选取GMM-UBM作为基准系统模型,用Eigen Voice对其作自适应,应用泛化能力较强的多项式核函数和学习能力较强的径向基核函数进行线性加权组合后的组合核函数进行模型参数优化,并用多重网格搜... 针对说话人识别实际应用中训练数据不足的问题,选取GMM-UBM作为基准系统模型,用Eigen Voice对其作自适应,应用泛化能力较强的多项式核函数和学习能力较强的径向基核函数进行线性加权组合后的组合核函数进行模型参数优化,并用多重网格搜索法确定核函数的最优参数,采用DAG方法实现SVM核函数的多元分类.在仿真实验中评估了线性核、多项式核、径向基核以及组合核函数,实验结果表明,在采用正确的参数前提下,在不同的多分类策略、自适应时间、信噪比和不同的说话人数量的情况下,组合核函数的识别性能明显都优于其它三个单核函数. 展开更多
关键词 说话人识别 组合核函数 SVM gmm-ubm
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部