期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
基于SDC特征和GMM-UBM模型的自动语种识别 被引量:14
1
作者 姜洪臣 郑榕 +1 位作者 张树武 徐波 《中文信息学报》 CSCD 北大核心 2007年第1期49-53,共5页
本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以... 本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以快速得到每个语种的模型。与传统的GMM方法相比,该方法的训练和识别的速度更快。该方法对OGI电话语音库中11个语种进行了测试,其10秒、30秒和45秒句子的最佳识别正确率分别为72.38%、82.62%和85.23%,识别速度约为0.03倍实时。 展开更多
关键词 计算机应用 中文信息处理 SDC特征 gmm-ubm模型 贝叶斯自适应 自动语种识别
下载PDF
一种改进的基于GMM-UBM的法庭自动说话人识别系统 被引量:4
2
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2013年第6期800-805,共6页
对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道... 对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道和移动手机信道的数据库进行了系统的测试. 展开更多
关键词 似然比 法庭自动说话人识别 高斯混合模型-通用背景模型
下载PDF
基于两种GMM-UBM多维概率输出的SVM语音情感识别 被引量:2
3
作者 黄永明 章国宝 +1 位作者 董飞 达飞鹏 《计算机应用研究》 CSCD 北大核心 2011年第1期98-101,共4页
针对GMM应用于情感识别时区分能力较弱的缺点,提出了一种将GMM与SVM有效结合的算法:基于GMM-UBM多维概率输出的SVM语音情感识别方法。该方法将GMM-UBM模型对一条语音的情感特征参数的两种多维概率输出(与特征向量同维、与GMM阶数同维)作... 针对GMM应用于情感识别时区分能力较弱的缺点,提出了一种将GMM与SVM有效结合的算法:基于GMM-UBM多维概率输出的SVM语音情感识别方法。该方法将GMM-UBM模型对一条语音的情感特征参数的两种多维概率输出(与特征向量同维、与GMM阶数同维)作为SVM分类器的特征参数,既利用了GMM表征数据本身统计特性的能力,又保留了SVM判决能力强的特点。在柏林情感语音库与汉语情感语料库上进行的实验结果表明,该方法在语音情感识别上的平均识别率较标准GMM方法提高1.7%~3.7%。 展开更多
关键词 语音情感识别 特征向量同维gmmubm多维概率输出 gmm阶数同维gmmubm多维概率输出 支持向量机(SVM)
下载PDF
基于CGMM-UBM的电话短语音说话人确认 被引量:2
4
作者 吴礼福 解焱陆 +1 位作者 戴蓓蒨 李辉 《电路与系统学报》 CSCD 北大核心 2007年第5期131-136,共6页
针对手机、电话的短语音文本无关说话人确认,本文设计了一种基于分类GMM-UBM(CGMM-UBM)的说话人确认系统。用k-means算法将训练背景模型的语音参数集分类成若干个子空间,并据此进行目标说话人语音数据的子空间分类,再采用GMM-UBM结构为... 针对手机、电话的短语音文本无关说话人确认,本文设计了一种基于分类GMM-UBM(CGMM-UBM)的说话人确认系统。用k-means算法将训练背景模型的语音参数集分类成若干个子空间,并据此进行目标说话人语音数据的子空间分类,再采用GMM-UBM结构为每个子空间分别建立一个子系统,以各个子系统输出评分的线性加权作为系统的输出评分。分类后的模型可以采用较低的混合度,线性加权增强了贡献较大子空间对确认性能的作用。在NIST’03语音库上100个男性话者的实验表明,短语音条件下,分类系统的性能比不分类系统有显著的改进,运算效率较后者也提高很多。 展开更多
关键词 电话语音 说话人确认 与文本无关 分类高斯混合模型-背景模型
下载PDF
基于超音段韵律特征和GMM-UBM的文本无关的说话人识别 被引量:1
5
作者 许东星 戴蓓蒨 +1 位作者 刘青松 许敏强 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第2期157-162,共6页
提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCC... 提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCCF0.在NIST068side-1side复杂背景电话手机语音数据库上的说话人确认实验则表明,采用一阶小波分析方法提取的超音段韵律参数PMFCC的识别性能与短时MFCC相当,采用超音段韵律特征PMFCCF0的系统确认性能比采用短时MFCC系统有较大的提高.在微软数据库进行不同信噪比测试语音的说话人辨认实验表明,PMFCCF0有比短时MFCC更好的噪声鲁棒性. 展开更多
关键词 超音段韵律特征 gmmubm 文本无关 说话人识别
下载PDF
GMM-UBM和SVM在说话人识别中的应用 被引量:7
6
作者 李荟 赵云敏 《计算机系统应用》 2018年第1期225-230,共6页
针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题.选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较... 针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题.选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较强、学习能力较差与径向基核函数学习能力较强、泛化能力较差的特性,对两种单核核函数进行线性加权组合,以使组合核函数兼具各单核的优点.仿真实验结果表明,组合核函数SVM的识别率和等错误率明显优于不引入SVM的GMM-UBM的基线系统及其它三个单核函数,并在不同信噪比情况下也兼顾了系统识别准确率与鲁棒性. 展开更多
关键词 说话人识别 gmm-ubm SVM 组合核函数
下载PDF
基于GMM-UBM说话人模型的连续自适应算法研究 被引量:2
7
作者 张正平 张丽娜 贺松 《通信电源技术》 2016年第2期81-83,共3页
实际应用中与文本无关的说话人识别研究,模型训练的说话人语音一般是有限的。此外,由于说话人自身生理因素的改变、外部采集环境的变化等都可能会导致说话人语音的声学特征发生改变。因此,代表说话人模型的特征分布也在不断变化,从而造... 实际应用中与文本无关的说话人识别研究,模型训练的说话人语音一般是有限的。此外,由于说话人自身生理因素的改变、外部采集环境的变化等都可能会导致说话人语音的声学特征发生改变。因此,代表说话人模型的特征分布也在不断变化,从而造成说话人识别系统识别率下降。文中在说话人自适应技术的基础上,提出了说话人模型的连续自适应算法,解决了因说话人自身声学特征的变化导致识别率下降的问题。 展开更多
关键词 说话人识别 gmm-ubm 最大后验概率 连续自适应
下载PDF
基于GMM-UBM的说话人确认系统的研究
8
作者 霍春宝 张彩娟 赵红敏 《辽宁工业大学学报(自然科学版)》 2012年第2期98-101,157,共4页
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数?,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者... 在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数?,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM-UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。 展开更多
关键词 说话人识别 高斯混合模型 EM算法 gmm-ubm
下载PDF
基于GMM-UBM的说话人确认系统的研究
9
作者 霍春宝 张彩娟 赵红敏 《辽宁工业大学学报(自然科学版)》 2012年第3期149-151,157,共4页
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在... 在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降.采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM—UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。 展开更多
关键词 说话人识别 高斯混合模型 EM算法 gmm-ubm
下载PDF
基于GMM-UBM的语言辨识算法研究
10
作者 陈业仙 张歆奕 毛杰 《五邑大学学报(自然科学版)》 CAS 2010年第3期56-60,共5页
运用Matlab软件,以自已建立的语音数据库为基础,对与文本无关的基于GMM-UBM的语言辨识系统进行了测试,获得的平均识别率达74%,与传统GMM算法的测试对比,基于GMM-UBM的语言辨识算法能更好地改善语言辨识系统的性能.
关键词 语言辨识 高斯混合-全局背景模型 期望最大化 贝叶斯自适应算法
下载PDF
基于子带GMM-UBM的广播语音多语种识别 被引量:2
11
作者 李思一 戴蓓蒨 王海祥 《数据采集与处理》 CSCD 北大核心 2007年第1期14-18,共5页
提出了一种基于概率统计模型的与语言内容无关的语种识别方法,它不需要掌握各语种的专业语言学知识就可以实现几十种语言的语种识别;并针对广播语音噪声干扰大的特点,采用GMM-UBM模型作为语种模型,提高了系统的噪声鲁棒性;由于广播语音... 提出了一种基于概率统计模型的与语言内容无关的语种识别方法,它不需要掌握各语种的专业语言学知识就可以实现几十种语言的语种识别;并针对广播语音噪声干扰大的特点,采用GMM-UBM模型作为语种模型,提高了系统的噪声鲁棒性;由于广播语音的背景噪声不是简单的全频带加性白噪声,因此本文构建了一种基于子带GMM-UBM模型的多子系统结构的语种识别系统,后端采用神经网络进行系统级融合。本文通过对37种语言及方言的识别实验,证明了子带GMM-UBM方法的有效性。 展开更多
关键词 语种识别 语言内容无关 广播语音 子带gmmubm
下载PDF
基于GMM-UBM的声纹识别技术的特征参数研究 被引量:16
12
作者 周玥媛 孔钦 《计算机技术与发展》 2020年第5期76-83,共8页
声纹识别技术实现的关键点在于从语音信号中提取语音特征参数,此参数具备表征说话人特征的能力。基于GMM-UBM模型,通过Matlab实现文本无关的声纹识别系统,对主流静态特征参数MFCC、LPCC、LPC以及结合动态参数的MFCC,从说话人确认与说话... 声纹识别技术实现的关键点在于从语音信号中提取语音特征参数,此参数具备表征说话人特征的能力。基于GMM-UBM模型,通过Matlab实现文本无关的声纹识别系统,对主流静态特征参数MFCC、LPCC、LPC以及结合动态参数的MFCC,从说话人确认与说话人辨认两种应用角度进行性能比较。在取不同特征参数阶数、不同高斯混合度和使用不同时长的训练语音与测试语音的情况下,从理论识别效果、实际识别效果、识别所用时长、识别时长占比等多个方面进行了分析与研究。最终结果表明:在GMM-UBM模式识别方法下,三种静态特征参数中MFCC绝大多数时候具有最佳识别效果,同时其系统识别耗时最长;识别率与语音特征参数的阶数之间并非单调上升关系。静态参数在结合较佳阶数的动态参数时能够提升识别效果;增加动态参数阶数与提高系统识别效果之间无必然联系。 展开更多
关键词 gmm-ubm 声纹识别 特征参数性能 说话人确认 说话人辨认
下载PDF
基于GMM-UBM/SVM的维吾尔语电话语音监控系统 被引量:2
13
作者 李晓阳 伊.达瓦 +1 位作者 吾守尔.斯拉木 勾坂芳典 《计算机应用与软件》 CSCD 北大核心 2012年第1期46-48,77,共4页
讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设... 讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。 展开更多
关键词 电话语音监控 说话人识别 维吾尔语 gmm-ubm SVM
下载PDF
基于特征融合与改进GMM-UBM的方言分析 被引量:1
14
作者 徐芝灿 刘本永 《通信技术》 2023年第4期419-424,共6页
针对单一特征在描述方言间差异性方面存在不足和传统高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)在训练时存在混叠的问题,在将经验模式分解引入到特征提取的基础上,融合多特征形成高维特征。进一... 针对单一特征在描述方言间差异性方面存在不足和传统高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)在训练时存在混叠的问题,在将经验模式分解引入到特征提取的基础上,融合多特征形成高维特征。进一步,通过多次训练GMMUBM,筛选出最具区分性的方言模型以提升各方言模型间的区分性。方言种类识别对比实验结果表明,基于融合特征与改进GMM-UBM的方法优于传统方法。 展开更多
关键词 改进gmm-ubm 特征融合 经验模式分解 方言种类识别
下载PDF
基于VQ和GMM的实时声纹识别研究 被引量:3
15
作者 鲁晓倩 关胜晓 《计算机系统应用》 2014年第9期6-12,共7页
目前声纹识别系统已经实现较高的识别精度,但是随着目标说话人个数的增加,一般系统很难满足实时性的要求,由此提出一种双层识别模型.在第一层识别模型中,采用基于VQ-VPT(Vector Quantization-Vantage Point Tree)模型进行快速匹配,挑选... 目前声纹识别系统已经实现较高的识别精度,但是随着目标说话人个数的增加,一般系统很难满足实时性的要求,由此提出一种双层识别模型.在第一层识别模型中,采用基于VQ-VPT(Vector Quantization-Vantage Point Tree)模型进行快速匹配,挑选出与测试者声纹特征最相近的K个目标说话人声纹模型.在第二层识别模型中,采用GMM-UBM(Gaussian Mixture Model-Universal Background Model)模型,精确匹配上层模型得到的K个目标说话人声纹模型,并做出最终的判决.实验验证,双层识别模型在确保高识别精度的前提下,大幅度的提高了系统的识别速度. 展开更多
关键词 声纹识别 矢量量化 优势节点树 高斯混合模型 通用背景模型
下载PDF
基于UBM的发音质量评价算法 被引量:2
16
作者 李婧 黄双 张波 《计算机工程》 CAS CSCD 北大核心 2008年第22期207-209,共3页
将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化... 将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化的相似度比例对数为音素的发音质量分数,综合得到整旬发音的评分结果。实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,优于其他评分算法。 展开更多
关键词 全局背景模型 对数似然比 高斯混合模型 发音质量评价
下载PDF
基于改进MFCC和能量算子倒谱的语种识别
17
作者 陈思竹 龙华 邵玉斌 《计算机科学》 CSCD 北大核心 2024年第S02期367-372,共6页
针对广播语音信号低信噪比下语种识别准确率低和鲁棒性差的问题,提出了基于小波包变换改进MFCC和能量算子倒谱特征的语种识别算法。首先,采用小波包变换代替MFCC中的傅里叶变换和Mel滤波得到WMFCC特征参数。在保留人耳听觉感知特性的基... 针对广播语音信号低信噪比下语种识别准确率低和鲁棒性差的问题,提出了基于小波包变换改进MFCC和能量算子倒谱特征的语种识别算法。首先,采用小波包变换代替MFCC中的傅里叶变换和Mel滤波得到WMFCC特征参数。在保留人耳听觉感知特性的基础上提升语音信号的高频分析能力和分析精确度,克服傅里叶变换的局限性。其次,提取Teager能量算子倒谱,得到语音瞬时能量的特性,与改进的MFCC特征参数融合得到新的特征参数TWMFCC。最后,为进一步提升低信噪比语音的识别效果,提出了VMD自适应维纳滤波去噪算法。通过实验对比了所提特征与传统特征的识别效果,所提特征的平均识别准确率显著提升,带噪语音在未进行语音去噪处理的情况下较传统MFCC高13.02%,有效改善了传统特征在低信噪比下识别准确率低的问题,具有较强的抗噪性和鲁棒性。 展开更多
关键词 语种识别 MFCC 小波包变换 能量算子倒谱 gmm-ubm
下载PDF
基于改进PNCC特征和两步区分性训练的录音设备识别方法 被引量:9
18
作者 贺前华 王志锋 +2 位作者 Alexander I Rudnicky 朱铮宇 李新超 《电子学报》 EI CAS CSCD 北大核心 2014年第1期191-198,共8页
录音设备来源识别是通过分析已获取的数字语音信号从而确定其录制设备的一种技术,属于数字音频盲取证.本文提出了一种基于改进PNCC特征和两步区分性训练的录音设备识别方法,由于音频中的静音包含了完整的设备信息,且不受说话人和文本等... 录音设备来源识别是通过分析已获取的数字语音信号从而确定其录制设备的一种技术,属于数字音频盲取证.本文提出了一种基于改进PNCC特征和两步区分性训练的录音设备识别方法,由于音频中的静音包含了完整的设备信息,且不受说话人和文本等因素的影响,因此从静音段提取改进的PNCC特征,利用了PNCC的长时帧分析去除背景噪声对设备信息的影响.在模型方面,以GMM-UBM为基准模型,并通过两步区分性训练调整集内设备模型和通用背景模型,提升模型区分能力.该方法对于30种设备闭集识别的平均正确识别率为90.23%;对于15个集内和15个集外设备的测试,等错误率为15.17%,集内平均正确识别率为96.65%,验证了本文算法的有效性. 展开更多
关键词 数字音频取证 录音设备识别 gmm-ubm 区分性训练 PNCC
下载PDF
音源特征用于提高话者确认系统的鲁棒性 被引量:2
19
作者 吴礼福 姚志强 +1 位作者 戴蓓蒨 李辉 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第5期476-480,共5页
给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数:短时(单帧)特征参数和较长时(多帧)特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线... 给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数:短时(单帧)特征参数和较长时(多帧)特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线性加权对主、辅子系统的输出进行融合.在NIST’03数据库上100个男性话者的对比实验表明,音源特征参数具有良好的噪声鲁棒性,声道特征与音源特征具有较强的互补性,尤其是在较强的噪声背景下,利用音源特征可以有效地提高以声道倒谱参数为特征的确认系统的鲁棒性. 展开更多
关键词 音源特征 话者确认 噪声鲁棒性 高斯混合模型-背景模型
下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
20
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 S变换 奇异值分解 基于S变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部