-
题名基于MFCC和运动强度聚类初始化的多说话人识别
被引量:10
- 1
-
-
作者
曹洁
余丽珍
-
机构
兰州理工大学计算机与通信学院
兰州理工大学电气工程与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2012年第9期3295-3298,共4页
-
基金
甘肃省自然科学基金资助项目(1014ZSB064)
甘肃省财政厅资助项目(0914ZTB148)
-
文摘
针对常用基于音频特征的多说话人聚类初始化方法精度不高这一问题,提出了一种基于视频信号的新方法。该方法通过运用每一时间帧视频信号的运动强度特征对聚类初始化阶段的初始话者类进行选择,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,在整个会议集上该方法相比其他方法有了很大改善,较之线性初始化系统的错误识别率平均降低了19.436%,较之改进的线性初始化系统的错误识别率平均降低了16.618%。
-
关键词
多说话人识别
聚类初始化
运动强度特征
运动强度初始化
-
Keywords
multi-speaker recognition
clustering initialization
motion intensity feature
motion intensities initialization
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的说话人聚类初始化和GMM的多说话人识别
被引量:6
- 2
-
-
作者
曹洁
余丽珍
-
机构
兰州理工大学计算机与通信学院
兰州理工大学电气工程与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2012年第2期590-593,共4页
-
基金
甘肃省财政厅资助项目(0914ZTB148)
甘肃省自然科学基金资助项目(1014ZSB064)
-
文摘
针对多说话人聚类线性初始化方法精度较差的问题,提出了一种改进的聚类初始化方法。该方法引入BIC对由线性初始化产生的初始类进行检测分割,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,所提方法使说话人平均类纯度(ACP)提高了48.51%,系统的错误识别率平均降低12.09%。
-
关键词
多说话人识别
改进的聚类初始化
高斯混合模型
平均类纯度
-
Keywords
multi-speaker recognition
improved clustering initialization
Gaussian mixture model
average cluster purity
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Fast ICA的多说话人识别系统
- 3
-
-
作者
周燕
-
机构
苏州市职业大学电子信息工程系
-
出处
《苏州市职业大学学报》
2011年第2期10-13,共4页
-
基金
苏州市职业大学创新团队基金资助项目(3100125)
江苏省"青蓝工程"资助项目
-
文摘
针对多人混合语音条件下说话人身份难以识别的问题,提出了一种使用快速独立分量分析(Fast ICA)方法分离各个说话人的语音信号,并采用RBF神经网络方法进行说话人识别的策略.由于不同语音源信号保持相对独立,利用盲信号分离的思想,使用Fast ICA方法用于信号的分离,从而对获得的独立语音数据分别提取说话人特征,采用RBF神经网络模型实现多说话人身份的识别.实验结果表明,该方法能有效地实现混合语音条件下的说话人识别.
-
关键词
多说话人识别
快速独立分量分析
RBF神经网络
-
Keywords
multi-speaker recognition
Fast ICA
RBF neural network
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-