期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于贝叶斯通用背景模型的图像标注 被引量:9
1
作者 杨栋 周秀玲 郭平 《自动化学报》 EI CSCD 北大核心 2013年第10期1674-1680,共7页
在高斯图特征提取过程中,通用背景模型(Universal background model,UBM)方法常用于根据总体分布估计每一幅图像中特征点分布的高斯混合模型(Gaussian mixture model,GMM)参数.然而UBM估计的GMM权重参数中有很多接近零的数值,它们所对... 在高斯图特征提取过程中,通用背景模型(Universal background model,UBM)方法常用于根据总体分布估计每一幅图像中特征点分布的高斯混合模型(Gaussian mixture model,GMM)参数.然而UBM估计的GMM权重参数中有很多接近零的数值,它们所对应的高斯分量对分布估计贡献小却又都参与了计算,因此UBM的时间复杂度较高.为解决这个问题,本文提出Bayes UBM方法.通过引入受限的对称Dirichlet分布来描述GMM权重参数的先验分布,利用Bayes最大后验概率对GMM参数集进行估计.实验表明Bayes UBM方法不仅有效地降低了时间复杂度,而且提高了Corel数据集上的图像标注精度. 展开更多
关键词 图像标注 通用背景模型 高斯混合模型 贝叶斯估计
下载PDF
短时频谱通用背景模型群联合韵律的年龄语音转换 被引量:3
2
作者 惠琳 俞一彪 《声学学报》 EI CSCD 北大核心 2017年第6期762-768,共7页
提出一种短时频谱通用背景模型群与韵律参数相结合进行年龄语音转换的方法。谱参数转换方面,同一年龄段各说话者提取语音短时谱系数并建立高斯混合模型,然后依据语音特征相似性对说话者进行聚类,每一类训练一个通用背景模型,最终得到通... 提出一种短时频谱通用背景模型群与韵律参数相结合进行年龄语音转换的方法。谱参数转换方面,同一年龄段各说话者提取语音短时谱系数并建立高斯混合模型,然后依据语音特征相似性对说话者进行聚类,每一类训练一个通用背景模型,最终得到通用背景模型群和一组短时频谱转换函数。谱参数转换之后再对共振峰进一步微调。韵律参数转换方面,基频和语速分别建立单高斯和平均时长率模型来推导转换函数。实验结果显示,提出的方法在ABX和MOS等评价指标上比传统的双线性法有明显的优势,相对单一通用背景模型法的对数似然度变化率提高了4%。这一结果表明提出的方法能够使转换语音具有良好目标倾向性的同时有较好的语音质量,性能较传统方法有明显提升。 展开更多
关键词 背景模型 语音 时频谱 通用 共振峰频率 参数转换 高斯混合模型 基频 模型 正韵律
下载PDF
基于聚类和排序高斯混合模型的说话人确认
3
作者 余巍 李辉 《计算机工程》 CAS CSCD 北大核心 2011年第23期162-164,共3页
基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库... 基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库的实验结果表明,该方法能在基本保持系统识别性能的前提下,降低UBM的训练运算量。 展开更多
关键词 说话人确认 高斯混合模型 通用背景模型 聚类 排序高斯混合模型
下载PDF
一种改进的基于GMM-UBM的法庭自动说话人识别系统 被引量:4
4
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2013年第6期800-805,共6页
对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道... 对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道和移动手机信道的数据库进行了系统的测试. 展开更多
关键词 似然比 法庭自动说话人识别 高斯混合模型-通用背景模型
下载PDF
基于CGMM-UBM的电话短语音说话人确认 被引量:2
5
作者 吴礼福 解焱陆 +1 位作者 戴蓓蒨 李辉 《电路与系统学报》 CSCD 北大核心 2007年第5期131-136,共6页
针对手机、电话的短语音文本无关说话人确认,本文设计了一种基于分类GMM-UBM(CGMM-UBM)的说话人确认系统。用k-means算法将训练背景模型的语音参数集分类成若干个子空间,并据此进行目标说话人语音数据的子空间分类,再采用GMM-UBM结构为... 针对手机、电话的短语音文本无关说话人确认,本文设计了一种基于分类GMM-UBM(CGMM-UBM)的说话人确认系统。用k-means算法将训练背景模型的语音参数集分类成若干个子空间,并据此进行目标说话人语音数据的子空间分类,再采用GMM-UBM结构为每个子空间分别建立一个子系统,以各个子系统输出评分的线性加权作为系统的输出评分。分类后的模型可以采用较低的混合度,线性加权增强了贡献较大子空间对确认性能的作用。在NIST’03语音库上100个男性话者的实验表明,短语音条件下,分类系统的性能比不分类系统有显著的改进,运算效率较后者也提高很多。 展开更多
关键词 电话语音 说话人确认 与文本无关 分类高斯混合模型-背景模型
下载PDF
基于GMM-UBM的语言辨识算法研究
6
作者 陈业仙 张歆奕 毛杰 《五邑大学学报(自然科学版)》 CAS 2010年第3期56-60,共5页
运用Matlab软件,以自已建立的语音数据库为基础,对与文本无关的基于GMM-UBM的语言辨识系统进行了测试,获得的平均识别率达74%,与传统GMM算法的测试对比,基于GMM-UBM的语言辨识算法能更好地改善语言辨识系统的性能.
关键词 语言辨识 高斯混合-全局背景模型 期望最大化 贝叶斯自适应算法
下载PDF
自适应并行模型组合的鲁棒语音身份识别算法 被引量:6
7
作者 李聪 葛洪伟 《信号处理》 CSCD 北大核心 2018年第7期867-875,共9页
由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环... 由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环境与测试环境之间的不匹配现象,从而提高系统识别准确率和抗噪性能。首先,算法从测试语音中估计出噪声特征,然后用一个单高斯模型对噪声特征进行拟合得到噪声均值和协方差。最后,根据得出的噪声均值和协方差,调整训练好的高斯混合模型均值向量和协方差矩阵,使其尽可能地匹配测试环境。实验结果表明,该方法可以准确地重构干净语音的高斯混合模型参数,并且能够显著提高说话人识别的准确率,特别是在低信噪比情况下。 展开更多
关键词 说话人识别 特征补偿 并行模型组合 高斯混合模型-通用背景模型 噪声
下载PDF
TEO能量与Mel倒谱混合参数应用于说话人识别 被引量:4
8
作者 杨瑞田 周萍 杨青 《计算机仿真》 北大核心 2017年第8期215-219,264,共6页
特征提取是说话人识别中非常重要的一个环节,特征提取的结果直接影响系统的识别结果。提出一种将TEO与MFCC及其衍生参数结合的方法,将本文提取的特征参数与传统的MFCC,WMFCC与△MFCC通过GMM-UBM与SVM模型得出结果并比较。并在不同环境... 特征提取是说话人识别中非常重要的一个环节,特征提取的结果直接影响系统的识别结果。提出一种将TEO与MFCC及其衍生参数结合的方法,将本文提取的特征参数与传统的MFCC,WMFCC与△MFCC通过GMM-UBM与SVM模型得出结果并比较。并在不同环境下的进行实验,对算法进行了仿真实现。实验结果表明,在相同噪声背景不同信噪比时与相同信噪比不同的噪声背景这两种情况,提出的方法均得到了较好的结果,在检测纯语音数据时,对融合算法进行仿真实现,识别率也得到了提高。 展开更多
关键词 说话人识别 梅尔频率倒谱系数 高斯混合模型-通用背景模型 联合因子分析
下载PDF
基于听觉特性和发声特性的语种识别
9
作者 华英杰 朵琳 +1 位作者 刘晶 邵玉斌 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期807-814,共8页
针对现有的方法在低信噪比环境下语种识别性能不佳,提出了一种耳蜗滤波系数和声道冲激响应频谱参数相互融合的语种识别方法.该方法表征了人的耳蜗听觉特性和发声特性,首先提取模拟人耳听觉特性的耳蜗滤波系数,再融合表征人的发声特性的... 针对现有的方法在低信噪比环境下语种识别性能不佳,提出了一种耳蜗滤波系数和声道冲激响应频谱参数相互融合的语种识别方法.该方法表征了人的耳蜗听觉特性和发声特性,首先提取模拟人耳听觉特性的耳蜗滤波系数,再融合表征人的发声特性的声道冲激响应频谱参数,最后采用高斯混合通用背景模型对所提方法在语种识别上进行测试.实验结果表明,在4种信噪比环境下,该方法优于其他对比方法;相对于基于深度学习的对数Mel尺度滤波器能量特征,识别正确率提升了16.1%,与其他方法相比有较大程度的提升. 展开更多
关键词 语种识别 耳蜗滤波系数 声道冲激响应频谱参数 高斯混合通用背景模型
下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
10
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 S变换 奇异值分解 基于S变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别
下载PDF
音源特征用于提高话者确认系统的鲁棒性 被引量:2
11
作者 吴礼福 姚志强 +1 位作者 戴蓓蒨 李辉 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第5期476-480,共5页
给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数:短时(单帧)特征参数和较长时(多帧)特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线... 给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数:短时(单帧)特征参数和较长时(多帧)特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线性加权对主、辅子系统的输出进行融合.在NIST’03数据库上100个男性话者的对比实验表明,音源特征参数具有良好的噪声鲁棒性,声道特征与音源特征具有较强的互补性,尤其是在较强的噪声背景下,利用音源特征可以有效地提高以声道倒谱参数为特征的确认系统的鲁棒性. 展开更多
关键词 音源特征 话者确认 噪声鲁棒性 高斯混合模型-背景模型
下载PDF
基于声纹识别的智能照明语音识别算法研究 被引量:8
12
作者 王建平 马兰兰 孙伟 《传感器与微系统》 CSCD 2020年第6期37-40,44,共5页
提出了一种基于声纹识别的智能照明语音识别算法。采用短时能量和短时平均过零率判别声控信号;采用基于高斯混合模型-通用背景模型(GMM-UBM)的方法判定声控人的身份;采用基于动态时间规整(DTW)的方法识别语义。通过建立多个身份人和多... 提出了一种基于声纹识别的智能照明语音识别算法。采用短时能量和短时平均过零率判别声控信号;采用基于高斯混合模型-通用背景模型(GMM-UBM)的方法判定声控人的身份;采用基于动态时间规整(DTW)的方法识别语义。通过建立多个身份人和多种声控命令的自适应实时语音训练样本库,采用对数似然分法和矢量累积距离法实现声控人身份认定与声控信号语义识别。仿真实验结果表明:该算法能快速准确判定与识别智能照明声控信号的身份和语义。 展开更多
关键词 声纹识别 智能照明 高斯混合模型-通用背景模型 动态时间规整
下载PDF
一种改进动态特征参数的话者语音识别系统 被引量:4
13
作者 申小虎 万荣春 张新野 《计算机仿真》 CSCD 北大核心 2015年第4期154-158,共5页
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种... 研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。 展开更多
关键词 话者语音识别系统 美尔频率倒谱系数 滑动差分倒谱特征 动态时频倒谱系数 混合高斯-通用背景模型
下载PDF
语种识别算法中GSV计算的定点仿真与实现 被引量:1
14
作者 张丽 杨镇西 吉立新 《计算机工程与设计》 CSCD 北大核心 2012年第2期679-683,共5页
基于GSV-SVM的语种识别方法是目前最为流行的语种识别方法之一,其采用基于通用背景模型GMM-UBM的GSV作为声学模型,支持向量机SVM作为区分模型。大量仿真测试结果表明,GSV在整个系统中占的运算量为80%左右,是算法硬件实现的瓶颈。鉴于此... 基于GSV-SVM的语种识别方法是目前最为流行的语种识别方法之一,其采用基于通用背景模型GMM-UBM的GSV作为声学模型,支持向量机SVM作为区分模型。大量仿真测试结果表明,GSV在整个系统中占的运算量为80%左右,是算法硬件实现的瓶颈。鉴于此,对基于GSV的硬件实现方法进行了研究,提出了一种快速GSV定点计算方法,其采用addlog运算简化对数似然函数的计算,完成了语种识别的高效定点实现。实验结果表明,该定点方法的识别率与浮点识别基本一致,满足应用要求。 展开更多
关键词 语种识别 高斯混合模型-通用背景模型 GMM超矢量 定点实现 addlog运算
下载PDF
语言辨识系统的决策级融合研究 被引量:1
15
作者 屈丹 王波 王炳锡 《电声技术》 北大核心 2003年第11期55-59,共5页
文中利用不同参数提取方法对语言辨识系统决策级融合进行了研究。文中给出4种融合方式,实验系统采用了GMM-UBM模型,利用OGI-TS多语种电话语音语料库,对决策级融合性能进行了评估。实验表明,利用决策级融合技术,选择最佳融合方式,可以很... 文中利用不同参数提取方法对语言辨识系统决策级融合进行了研究。文中给出4种融合方式,实验系统采用了GMM-UBM模型,利用OGI-TS多语种电话语音语料库,对决策级融合性能进行了评估。实验表明,利用决策级融合技术,选择最佳融合方式,可以很好地改善语言辨识率。 展开更多
关键词 语言辨识 决策级融合 高斯混合模型-全局背景模型 贝叶斯自适应 数据融合
下载PDF
基于SVM评分融合的分类短语音话者确认系统
16
作者 解焱陆 吴礼福 +1 位作者 戴蓓蒨 李辉 《数据采集与处理》 CSCD 北大核心 2005年第2期213-217,共5页
对于与文本无关短电话语音(小于30s)的话者确认,在特征参数空间上分类并分别建模的方法,会带来多个子系统输出融合的问题。为了得到最终的评分,同时反映出各个子系统之间的非线性关系以及贡献的不同。本文提出了使用支持向量机(Supportv... 对于与文本无关短电话语音(小于30s)的话者确认,在特征参数空间上分类并分别建模的方法,会带来多个子系统输出融合的问题。为了得到最终的评分,同时反映出各个子系统之间的非线性关系以及贡献的不同。本文提出了使用支持向量机(Supportvectormachine,SVM)进行后端评分融合的方法,对输出的两类评分矢量(目标话者和冒认话者)进行分类。在NIST′03数据库上的实验表明,在短语音情况下该方法比评分相加融合方法性能可以相对提高约11%,SVM不仅适用于多子系统的评分级的融合,对其他的多系统多信息的融合也行之有效。 展开更多
关键词 信息融合 支持向量机 高斯混合模型-背景模型 话者确认
下载PDF
基于自适应同源方差控制的法庭自动说话人识别
17
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《应用科学学报》 CAS CSCD 北大核心 2014年第6期582-587,共6页
提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法.为了更准确地评估嫌疑人的统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型信息,降低了对嫌疑人数据量大小的... 提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法.为了更准确地评估嫌疑人的统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型信息,降低了对嫌疑人数据量大小的需求.与基本识别系统相比的测试结果表明,使用该算法的识别系统不但具有更优良的识别性能和可靠性,而且提高了语音证据对判别结论的支持强度. 展开更多
关键词 法庭自动说话人识别 背景模型-高斯混合模型 似然比 自适应同源方差控制
下载PDF
应用说话人聚类技术改善语言辨识系统识别率
18
作者 张强 屈丹 +1 位作者 侯风雷 王炳锡 《电声技术》 2007年第3期44-48,共5页
说话人差异是影响语言辨识系统性能的一个重要方面。采用说话人聚类技术对训练数据进行了预分类,以此为基础训练各种语言模型,得到聚类后的语言辨识系统。高斯混合模型、高斯混合模型-全局背景模型和遍历隐马尔可夫模型3种语言模型的实... 说话人差异是影响语言辨识系统性能的一个重要方面。采用说话人聚类技术对训练数据进行了预分类,以此为基础训练各种语言模型,得到聚类后的语言辨识系统。高斯混合模型、高斯混合模型-全局背景模型和遍历隐马尔可夫模型3种语言模型的实验证明,这种方法是有效的,它普遍地减小了说话人差异对语言辨识的影响,提高了语言辨识率。 展开更多
关键词 说话人聚类 高斯混合模型-全局背景模型 遍历隐马尔可夫模型
下载PDF
GMM-UBM和SVM说话人辨认系统及融合的分析 被引量:9
19
作者 鲍焕军 郑方 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期693-698,共6页
在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在... 在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够。该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能。在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30%和SVM系统的8.26%降低到7.34%,分别相对降低了21.08%和11.14%。 展开更多
关键词 说话人辨认 Gauss混合模型-通用背景模型(gmm-ubm) 支持向量机(SVM) 信道鲁棒
原文传递
基于i向量的SVM说话人确认
20
作者 吴文昭 《兰州文理学院学报(自然科学版)》 2016年第3期53-55,共3页
针对SVM处理定长语音向量的局限,将新型的定长i向量应用于说话人确认.该算法首先在整体注册说话人的高斯混合通用背景模型上应用MAP自适应算法提取说话人的GMM超向量,紧接着在超向量空间分析全局差异空间矩阵,获得低维的定长i向量,用于... 针对SVM处理定长语音向量的局限,将新型的定长i向量应用于说话人确认.该算法首先在整体注册说话人的高斯混合通用背景模型上应用MAP自适应算法提取说话人的GMM超向量,紧接着在超向量空间分析全局差异空间矩阵,获得低维的定长i向量,用于支持向量机的训练.仿真实验结果验证了该算法的有效性. 展开更多
关键词 说话人确认 i向量 高斯混合通用背景模型 GMM超向量:支持向量机
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部