-
题名添加音素持续时间信息到频谱模型的说话人辨认研究
- 1
-
-
作者
刘大鹏
尾关和彦
朱庆生
-
机构
重庆大学计算机学院
电气通信大学信息通信工程系
-
出处
《计算机技术与发展》
2007年第5期156-159,共4页
-
文摘
传统的声音识别系统通过短时声音频谱信息来辨识说话人,这种方法在某些条件下具有较好的性能。但是由于有些说话人特征隐藏在较长的语音片段中,通过添加长时信息可能会进一步提高系统的性能。在文中,音素持续时间信息被添加到传统模型上,以提高说话人辨识率。频谱信息是通过短时分析获得的,但音素持续时间的提取却属于长时分析,它需要更多的语音数据。通过大量语音数据探讨了音素持续时间信息对说话人辨识的有效性,提出2种方法来解决数据量小所引起的问题。实验结果表明,当说话人的声音模型被恰当建立时,即使在语音数据量小的情况下,音素持续时间信息对说话人辨识率的提高也是有效的。
-
关键词
说话人声音辨识
高斯混合模型
音素持续时间信息
-
Keywords
speaker identification
GMM
phoneme duration information
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
TN912.3
[电子电信—通信与信息系统]
-