-
题名改进的说话人聚类初始化和GMM的多说话人识别
被引量:6
- 1
-
-
作者
曹洁
余丽珍
-
机构
兰州理工大学计算机与通信学院
兰州理工大学电气工程与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2012年第2期590-593,共4页
-
基金
甘肃省财政厅资助项目(0914ZTB148)
甘肃省自然科学基金资助项目(1014ZSB064)
-
文摘
针对多说话人聚类线性初始化方法精度较差的问题,提出了一种改进的聚类初始化方法。该方法引入BIC对由线性初始化产生的初始类进行检测分割,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,所提方法使说话人平均类纯度(ACP)提高了48.51%,系统的错误识别率平均降低12.09%。
-
关键词
多说话人识别
改进的聚类初始化
高斯混合模型
平均类纯度
-
Keywords
multi-speaker recognition
improved clustering initialization
Gaussian mixture model
average cluster purity
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名语音机器人隐马尔可夫算法探究
被引量:1
- 2
-
-
作者
黄哲彬
-
机构
华北水利水电大学信息工程学院
-
出处
《现代信息科技》
2018年第4期95-96,98,共3页
-
文摘
一直以来,人们在探索一种人与机器交流的方法。随着科学技术的飞速发展,语音机器人的出现,实现了真正意义上的人机交流。隐马尔可夫模型(HMM)作为非特定语音识别系统的主流技术在语音机器人系统中被广泛地使用。传统的隐马尔可夫模型由于初始化方法过于简单,精度和速度都达不到预期结果。实验证明,改进语音特征参数相邻帧相关性的隐马尔可夫模型初始化算法能有效地解决这一问题。
-
关键词
非特定人语音识别
隐马尔可夫模型
初始化算法
-
Keywords
speaker independent speech recognition
hidden Markov model
initialization algorithm
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名汉语讲话者辨别方法研究
被引量:7
- 3
-
-
作者
林宝成
陈永彬
-
机构
东南大学无线电工程系
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
1998年第1期62-66,共5页
-
基金
全国博士后基金资助
江苏省自然科学基金
国家自然科学
-
文摘
根据讲话者在讲话时鼻腔相对固定以及汉语鼻音声母少(只有m-和n-两种)的特点,使用极零模型,并以所有汉语鼻声母音节的零点谱为参数,实现汉语讲话者辨别.所选择的参数稳定、有效,系统模板存储量少.系统训练和识别的运算量小,其规模在20个人时的性能为:用各个人所有单个声母测试时.首选总正识率为67.02%;随机地用3,4,5个声母平均后测试时,则首选正识率分别可达93.33%、96.7%、98.3%.
-
关键词
讲话者识别
鼻音声母
极零模型
语音信号处理
-
Keywords
speaker recognition, nose initials, arma model
-
分类号
TN912.34
[电子电信—通信与信息系统]
TP391.42
[自动化与计算机技术—计算机应用技术]
-