基于支持说话人权重的快速说话人自适应算法

A Rapid Speaker Adaptation Based on Support Speaker Weighting

下载PDF

导出

摘要针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法. A novel model-based speaker adaptation algorithm, support speaker weighting （SSW）, was proposed for rapid speaker adaptation in speech recognition systems. It realizes the specific speaker selection and dimensionality reduction by computing the support speaker subsets from many reference speakers. This method yields major improvements in performance for tiny amounts of adaptation data while greatly reducing the memory requirement. The experiments on the supervised adaptation demonstrate that the relative error rate reduction of 5.82% is achieved when only one adaptation sentence is available. In comparison with other rapid speaker adaptation algorithms, SSW is more effective.

作者蔡铁朱杰

机构地区上海交通大学电子工程系

出处《上海交通大学学报》 EI CAS CSCD 北大核心 2005年第12期1997-2001,共5页 Journal of Shanghai Jiaotong University

基金上海市科学技术委员会基础研究基金项目(01JC14033)

关键词语音识别说话人自适应支持向量机支持说话人权重 speech recognition speaker adaptation support vector machine support speaker weighting

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1Gauvain J L,Lee C H.Maximum a posteriori estimation for multivariate Gaussian mixture observations of Markov chains[J].IEEE Trans on Speech and Audio Processing,1994,2(2):291-298.
2李虎生,刘加,刘润生.语音识别说话人自适应研究现状及发展趋势[J].电子学报,2003,31(1):103-108. 被引量：32
3Leggetter C J,Woodland P C.Maximum likelihood linear regression for speaker adaptation of continuous-density hidden markov models[J].Computer Speech and Language,1995,9(2):171-185.
4Hazen T.The use of speaker correlation information for automatic speech recognition[D].Combridge:Massachusetts Institute of Technology,1998.
5Kuhn R,Junqua J C,Nguyen P,et al.Rapid speaker adaptation in eigenvoice space[J].IEEE Trans on Speech and Audio Processing,2000,8(6):695-707.
6吕萍,吴及,王作英,陆大.连续语音识别中的说话人快速自适应技术[J].清华大学学报（自然科学版）,2002,42(7):977-980. 被引量：4
7Padmanabhan M,Bahl L,Nahamoo D,et al.Speaker clustering and transformation for speaker adaptation in speech recognition systems[J].IEEE Trans on Speech and Audio Processing,1998,6(1):71-77.
8Huang C,Chen T,Chang E.Speaker selection training for large vocabulary continuous speech recognition[A].Proceedings of ICASSP2002[C].Orlando,FL:[s.n.],2002,1(1):I-609-I-612.
9Vapnik V.The nature of statistical learning theory[M].New York:Springer Verlag,1995.

二级参考文献3

1王作英.基于段长分布的HMM语音识别模型.第二届全国汉字语音识别会议[M].庐山,1989..
2张昊天.[D].北京:清华大学电子工程系,2000.
3李虎生,杨明杰,刘润生.汉语数码语音识别自适应算法[J].电路与系统学报,1999,4(2):1-6. 被引量：4

共引文献34

1蔡铁,朱杰.基于结构化特征语音模型的区别性说话人自适应算法[J].上海交通大学学报,2005,39(S1):138-142.
2杨吉斌,邢艳玲,曹铁勇,张雄伟.基于Mellin变换和Mel频率分析的非特定人语音识别特征研究[J].模式识别与人工智能,2005,18(3):350-353. 被引量：2
3李财莲,赵小阳,王丽娟,岳振军.说话人识别中关键技术的现状与发展[J].军事通信技术,2005,26(2):62-65. 被引量：3
4徐向华,朱杰,郭强.决策树结构对说话人自适应影响的研究[J].声学学报,2006,31(1):42-47. 被引量：3
5黄盈椿,王欢良,冯涛.应用MAP方差估计的话者自适应训练方法[J].计算机工程,2006,32(20):203-204.
6倪建克,曾虹,张翔.基于最大均值似然判决规则的说话人辨认研究[J].杭州电子科技大学学报（自然科学版）,2006,26(5):96-99.
7申朝文,何家峰,蔡继祖.说话人识别技术的方法与展望[J].中国科技信息,2007(4):269-270.
8朴春俊,李玉萍,韩永成.基于特征语音的说话人自适应算法研究[J].信息技术,2007,31(8):101-103.
9朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15
10武永星,郑海,周波,杨常青,李茂林.基于距离和相关性准则的混合参数说话人识别[J].系统仿真学报,2008,20(4):926-930.

1吕萍,王作英,陆大.基于高斯相似度分析的插值自适应算法[J].电子学报,2001,29(z1):1759-1761. 被引量：2
2屈丹,杨绪魁,张文林.特征空间本征音说话人自适应[J].自动化学报,2015,41(7):1244-1252. 被引量：4
3张文林,张连海,牛铜,屈丹,李弼程.基于正则化的本征音说话人自适应方法[J].自动化学报,2012,38(12):1950-1957. 被引量：9
4刘刚,张洪刚,郭军.不同训练样本对识别系统的影响[J].计算机学报,2005,28(11):1923-1928. 被引量：15
5丰洪才,卢正鼎.基于置信度的无监督说话人自适应语音识别[J].计算机工程与科学,2005,27(9):93-96. 被引量：1
6郭宏,丁晓青,郭繁夏,吴佑寿.汉字识别多分类器集成的新方法[J].清华大学学报（自然科学版）,1997,37(10):91-94. 被引量：9
7徐向华,朱杰,郭强.决策树结构对说话人自适应影响的研究[J].声学学报,2006,31(1):42-47. 被引量：3
8王晶莹,王作英.利用隐空间投影算法的模型自适应方法[J].清华大学学报（自然科学版）,2007,47(7):1159-1161.
9肖述才,欧智坚,王作英.语音识别中的一种说话人聚类算法[J].中文信息学报,2005,19(4):84-88. 被引量：4
10王炜,吕萍,颜永红.一种改进的基于层次聚类的说话人自动聚类算法[J].声学学报,2008,33(1):9-14. 被引量：4

上海交通大学学报

2005年第12期

浏览历史

内容加载中请稍等...

基于支持说话人权重的快速说话人自适应算法

参考文献9

二级参考文献3

共引文献34

相关作者

相关机构

相关主题

浏览历史