-
题名语言辨识的矢量量化方法(VQ)
- 1
-
-
作者
屈丹
王炳锡
魏鑫
-
机构
信息工程大学信息工程学院
-
出处
《信息工程大学学报》
2002年第3期54-57,共4页
-
文摘
与语音处理的其他领域相比 ,自动语言辨识是一个相对较新的研究 ,而且是一项较难的课题。本文给出了语言辨识的两种矢量量化方法 ,并利用OGI TS电话语音库对 2种算法的性能进行了测试 ,然后给出了实验结果。 2种算法的最佳识别率分别为 6 5 .3 8%和 73 .0 8%。
-
关键词
语言辨识
OGI-TS
特征提取
LPCC
MFCC
ASCC
标准矢量量化
矢量量化直方图
-
Keywords
language identification
OGI-TS
feature extraction
LPCC
MFCC
ASCC
standard VQ algorithm
VQ histogram algorithm
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于概率统计直方图的压缩域说话人识别
- 2
-
-
作者
屈丹
闫红刚
唐晖
王炳锡
-
机构
解放军信息工程大学信息工程学院
-
出处
《数据采集与处理》
CSCD
北大核心
2009年第5期594-599,共6页
-
基金
国家"八六三"高技术研究发展计划(2006AA01Z146)资助项目
-
文摘
压缩域说话人识别算法(Compressed-domain automatic speaker recognition,CD-ASR)即从压缩语音数据中直接提取压缩参数进行说话人识别,无需参数译码和波形合成。本文提出了基于概率统计直方图的VoIP压缩域说话人识别算法,包括矢量量化统计直方图和高斯混合模型统计直方图两种方法。在给出了G.729,G.723.1(6.3 kb/s),G.723.1(5.3 kb/s)压缩码流的压缩域特征提取方案后,分别以矢量量化统计直方图和高斯混合模型统计直方图作为识别模型进行说话人识别。实验结果表明,概率统计直方图法比在压缩码流中提取同样识别参数的GMM模型,识别率有很大提高。
-
关键词
压缩域说话人识别
矢量量化概率统计直方图
高斯混合模型概率统计直方图
-
Keywords
compressed-domain automatic speaker recognition (CD-ASR)
vector quantization probabilistic stochastic histogram(VQPSH)
Gaussian mixture model probabilistic stochastic histogram (GMMPSH)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-