期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
GMM文本无关的说话人识别系统研究 被引量:27
1
作者 蒋晔 唐振民 《计算机工程与应用》 CSCD 北大核心 2010年第11期179-182,195,共5页
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。... 在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 展开更多
关键词 说话人识别 高斯混合模型 美尔频率倒谱系数(MFCC) 分裂法与K均值聚类结合法
下载PDF
基于差分特征和高斯混合模型的湖南方言识别 被引量:4
2
作者 王岐学 钱盛友 赵新民 《计算机工程与应用》 CSCD 北大核心 2009年第35期129-131,共3页
语音的韵律是区分汉语方言的重要语音声学特征,而语音的差分特征是语音韵律的重要体现。采用差分特征ΔMFCC和ΔΔMFCC作为特征参数,用高斯混合模型(GMM)作为训练模型,通过计算测试样本的似然概率来识别方言的类型。用该方法对长沙方言... 语音的韵律是区分汉语方言的重要语音声学特征,而语音的差分特征是语音韵律的重要体现。采用差分特征ΔMFCC和ΔΔMFCC作为特征参数,用高斯混合模型(GMM)作为训练模型,通过计算测试样本的似然概率来识别方言的类型。用该方法对长沙方言、邵阳方言、衡阳方言和普通话进行了识别研究,并与采用MFCC作为特征参数的识别效果进行了比较。实验结果表明差分特征具有识别率高、抗噪声性能更好等优点。 展开更多
关键词 差分特征 高斯混合模型 方言识别
下载PDF
利用模型选择确定视觉词袋模型中词汇数目 被引量:3
3
作者 许明 韩军伟 +1 位作者 郭雷 尹文杰 《计算机工程与应用》 CSCD 北大核心 2011年第31期148-150,共3页
视觉词袋(Visual Bag-of-Words)模型在图像分类、检索和识别等计算机视觉领域有了广泛的应用,但是视觉词袋模型中词汇数目往往是根据经验确定或者采用有监督的交叉学习选取。提出一种确定视觉词袋模型中词汇数目的无监督方法,利用模型... 视觉词袋(Visual Bag-of-Words)模型在图像分类、检索和识别等计算机视觉领域有了广泛的应用,但是视觉词袋模型中词汇数目往往是根据经验确定或者采用有监督的交叉学习选取。提出一种确定视觉词袋模型中词汇数目的无监督方法,利用模型选择的思想来解决问题。使用高斯混合模型描述具有不同词汇数目的视觉词袋,计算各模型贝叶斯信息准则的值,选取贝叶斯信息准则最小值对应的词汇数目。与交叉验证的监督学习在图像分类实验的对比结果说明该方法准确有效。 展开更多
关键词 视觉词袋模型 模型选择 高斯混合模型 贝叶斯信息准则
下载PDF
基于GMM的说话人识别技术研究 被引量:6
4
作者 曹洁 潘鹏 《计算机工程与应用》 CSCD 北大核心 2011年第11期114-117,共4页
为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的... 为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。 展开更多
关键词 高斯混合模型 语音活动检测 识别错误率
下载PDF
用于说话人辨识的评分规整
5
作者 刘明辉 黄中伟 熊继平 《计算机工程与应用》 CSCD 北大核心 2010年第12期133-135,共3页
在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,... 在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,有效地提高了系统性能。在NIST’031spk数据库上的说话人辨识实验表明了评分规整技术对说话人辨识的有效性。 展开更多
关键词 评分规整 说话人辨识 高斯混合模型 统一背景模型最大后验概率估计(UBM-MAP)
下载PDF
噪声环境下的窄带音频信号快速分类方法 被引量:1
6
作者 芮瑞 鲍长春 《计算机工程与应用》 CSCD 北大核心 2011年第16期22-25,共4页
提出了一种基于线性判别分析和高斯混合模型的窄带音频快速分类方法,该方法在白噪声、街道噪声和车内噪声环境下都能有效区分语音、音乐和噪声。实验结果表明,该方法在保证分类时间不大于1s的情况下,分类准确率能达到95以上。
关键词 音频快速分类 特征提取 线性判别分析 高斯混合模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部