-
题名GMM文本无关的说话人识别系统研究
被引量:27
- 1
-
-
作者
蒋晔
唐振民
-
机构
南京理工大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第11期179-182,195,共5页
-
文摘
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。
-
关键词
说话人识别
高斯混合模型
美尔频率倒谱系数(MFCC)
分裂法与K均值聚类结合法
-
Keywords
speaker recognition
gaussian mixture moda(lgmm)
Mel Frequency Cepstrum Coefficien(tMFCC)
combination division and K-means clustering
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于差分特征和高斯混合模型的湖南方言识别
被引量:4
- 2
-
-
作者
王岐学
钱盛友
赵新民
-
机构
湖南师范大学物理与信息科学学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第35期129-131,共3页
-
文摘
语音的韵律是区分汉语方言的重要语音声学特征,而语音的差分特征是语音韵律的重要体现。采用差分特征ΔMFCC和ΔΔMFCC作为特征参数,用高斯混合模型(GMM)作为训练模型,通过计算测试样本的似然概率来识别方言的类型。用该方法对长沙方言、邵阳方言、衡阳方言和普通话进行了识别研究,并与采用MFCC作为特征参数的识别效果进行了比较。实验结果表明差分特征具有识别率高、抗噪声性能更好等优点。
-
关键词
差分特征
高斯混合模型
方言识别
-
Keywords
differential feature
gaussian mixture Mode(lgmm)
dialects identification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名利用模型选择确定视觉词袋模型中词汇数目
被引量:3
- 3
-
-
作者
许明
韩军伟
郭雷
尹文杰
-
机构
西北工业大学自动化学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第31期148-150,共3页
-
基金
国家自然科学基金(No.61005018)
西北工业大学引进高层次人才科研启动费资助项目~~
-
文摘
视觉词袋(Visual Bag-of-Words)模型在图像分类、检索和识别等计算机视觉领域有了广泛的应用,但是视觉词袋模型中词汇数目往往是根据经验确定或者采用有监督的交叉学习选取。提出一种确定视觉词袋模型中词汇数目的无监督方法,利用模型选择的思想来解决问题。使用高斯混合模型描述具有不同词汇数目的视觉词袋,计算各模型贝叶斯信息准则的值,选取贝叶斯信息准则最小值对应的词汇数目。与交叉验证的监督学习在图像分类实验的对比结果说明该方法准确有效。
-
关键词
视觉词袋模型
模型选择
高斯混合模型
贝叶斯信息准则
-
Keywords
Visual Bag-of-Words
model selection
gaussian mixture Mode(lgmm)
Bayesian information criterion
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-
-
题名基于GMM的说话人识别技术研究
被引量:6
- 4
-
-
作者
曹洁
潘鹏
-
机构
兰州理工大学计算机与通信学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第11期114-117,共4页
-
基金
甘肃省自然科学基金No.1010RJZA046
甘肃省教育厅研究生导师基金项目(No.0914ZTB003)~~
-
文摘
为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。
-
关键词
高斯混合模型
语音活动检测
识别错误率
-
Keywords
gaussian mixture Mode(lgmm)
speech activity detection
recognition error rate
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名用于说话人辨识的评分规整
- 5
-
-
作者
刘明辉
黄中伟
熊继平
-
机构
深圳大学语音实验室
浙江师范大学数理信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第12期133-135,共3页
-
基金
深圳市残联培训经费项目
深圳大学科研启动基金项目(No.200811)
-
文摘
在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,有效地提高了系统性能。在NIST’031spk数据库上的说话人辨识实验表明了评分规整技术对说话人辨识的有效性。
-
关键词
评分规整
说话人辨识
高斯混合模型
统一背景模型最大后验概率估计(UBM-MAP)
-
Keywords
score normalization
speaker identification
gaussian mixture Mode(lgmm)
Universal Background Model-Maximum a Posterio(rUBM-MAP)
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名噪声环境下的窄带音频信号快速分类方法
被引量:1
- 6
-
-
作者
芮瑞
鲍长春
-
机构
北京工业大学电子信息与控制工程学院语音与音频信号处理实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第16期22-25,共4页
-
基金
北京市属高等学校人才强教计划资助项目
北京市教育委员会科技计划重点项目(No.KZ201110005005)
北京工业大学博士启动基金
-
文摘
提出了一种基于线性判别分析和高斯混合模型的窄带音频快速分类方法,该方法在白噪声、街道噪声和车内噪声环境下都能有效区分语音、音乐和噪声。实验结果表明,该方法在保证分类时间不大于1s的情况下,分类准确率能达到95以上。
-
关键词
音频快速分类
特征提取
线性判别分析
高斯混合模型
-
Keywords
fast audio classification
feature extraction
Linear Discriminant Analysis(LDA)
gaussian mixture Mode(lgmm)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-