基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究被引量：3

Study on the integration of phonetic and prosodic probability based on 3-dimension viterbi search

下载PDF

导出

摘要提出了一种在汉语连续语音识别中基于３维空间Ｖｉｔｅｒｂｉ算法的音素模型和声调模型识别概率的统合方法。该方法采用６０个音素单位的ＨＭＭ和８个声调单位的ＨＭＭ作为识别用基元模型。音素和声调基元模型识别结果的统合，采用音素的ＨＭＭ状态、声调的ＨＭＭ状态和时间的３维空间帧同步Ｖｉｔｅｒｂｉ算法来实现。本文还探讨了在该方法的基础上，给予不同路径限制时的匹配统合效果，并且通过和传统的匹配统合方式的比较，证明了提出的方法的有效性。 This paper presents a new method of continuous speech recognition for Chinese, in which phonetic and prosodic features were integrated in terms of 3-Dimension Viterbi search.The phonetic information was modeled as 60 phonemic HMMs and 11 tone HMMs of the prosodic information. Both models are synchronized based on 3-Dimension Viterbi search. We investigated integration methods of phonetic and prosodic likelihoods based on different at search paths and compared them with traditional method through the experiments on continuous speech recognition of Chinese. The efficiency of the proposed approach is verified in this paper.

作者赵力邹采荣吴镇扬

机构地区东南大学无线电工程系

出处《声学学报》 EI CSCD 北大核心 2001年第3期259-263,共5页 Acta Acustica

基金国家自然科学基金资助项目!(批准号69871009)

关键词汉语语音识别 3维空间 VITERBI 音素模型声调模型匹配统合语音信号 Probability Speech analysis

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1赵力,邹采荣,吴镇扬.汉语连续语音识别中语音处理和语言处理统合方法的研究[J].声学学报,2001,26(1):73-78. 被引量：9
2Zhao L，ICCOPOL'97，1997年，178页
3Zhao L，日本音响学会论文志，1997年，53卷，12期，933页
4Zhao L，IEICE Technical Report SP95 26，1995年，9页
5Zhao L，IEICE,TRANS INF and SYST ED，1995年，78卷，6期，669页
6Gao Y，Proc ICASSP，1995年，1期，77页
7Chien L F，IEEE Trans SAP，1993年，1卷，2期，221页
8Lei L，IEICE Technical Report SP90 105，1990年，90页

二级参考文献8

1新美康永.音声认识[M].日本共立出版社,1987..
2Zhao L，ICCCPOL'97，1997年，178页
3Zhao L，日本音响学会论文志，1997年，53卷，12期，933页
4Zhao L，IEICE Technical Report SP98 26，1995年，9页
5Zhao L，IEICE TRANS INF SYST ED，1995年，78卷，6期，66页
6Chien L F，IEEE Trans SAP，1993年，1卷，2期，221页
7Lei L，IEICE Technical Report SP90 105，1990年
8新美康永，音声认识，1987年

共引文献8

1黄启良.汉语方言语音识别系统的构建[J].广西科学院学报,2005,21(3):193-195.
2郑贵滨,韩纪庆,李海峰,郑铁然.基于分段的实时声频检索方法[J].声学学报,2006,31(2):101-108. 被引量：5
3韦向峰,张全,熊亮.一种基于语义分析的汉语语音识别纠错方法[J].计算机科学,2006,33(10):152-155. 被引量：2
4赵力,邹采荣,吴镇扬.HMM在说话人识别中的应用[J].电路与系统学报,2001,6(3):51-57. 被引量：10
5赵力.基于偶数帧段输入隐马尔可夫模型的噪声环境下汉语连续语音识别研究[J].声学学报,2002,27(1):59-61. 被引量：1
6王亚冉.基于语音识别技术的洗碗机智能交互控制设计[J].现代信息科技,2017,1(1):86-88. 被引量：1
7黄亚琳,董效杰,张远念,郑灏.基于STM32的语音呼救器[J].中小企业管理与科技,2018,2(16):123-124.
8蒋平,吴振国.声调识别错误的统计分析——语音输入软件测试报告之一[J].语言文字应用,2003(2):22-29. 被引量：4

同被引文献40

1王韫佳.音高和时长在普通话轻声知觉中的作用[J].声学学报,2004,29(5):453-461. 被引量：33
2Pandey P C, Bhandorkar S M. Enhancement of alaryngeal speech using spectral subtraction. Digital Signal Processing, 2002; 12(2): 591-594
3Zhong Lin, Rafik Goubran. Musical noise reduction in speech using two-dimensional spectrogram enhancement.Proceedings of HAVE, 2003; 20(5): 61-64
4Tadj C, Gabrea M. Towards robustness in speaker verification: Enhancement and adaptation. Midwest Symposium on Circuits and Systems, 2002; 3(3): 320-323
5Soon I Y, Koh S N. Speech enhancement using 2-D Fourier transform. IEEE Transactions on Speech and Audio Processing, 2003; 11(6): 717-724
6Douglas Reynolds A. Speaker identification and verification using Gaussian mixture speaker models. Speech Communication, 1995; 17(1): 91-108
7Matsui T, Furui S. Concatenated phoneme models for text variable speaker recognition. ICASSP. 1993; 2(2): 391-394
8Markov K, Nakagawa S.Text-independent speaker recognition system using frame level likelihood processing. Technical Report of IEICE, 1996; 96(17): 37-44
9Ke Chen. Towards better making a decision in speaker verification. Pattern Recognition, 2003; 36(2) : 329-346
10Reynolds D A, Rose R C. Robust text-independent speaker identification using Gaussian mixture speaker models.IEEE Trans. On Speech and Audio Processing, 1995; 3(1):72-83

引证文献3

1包永强,赵力,邹采荣.采用归一化补偿变换的与文本无关的说话人识别[J].声学学报,2006,31(1):55-60. 被引量：13
2黄浩,朱杰.汉语语音识别中基于区分性权重训练的声调集成方法[J].声学学报,2008,33(1):1-8. 被引量：2
3HUANG Hao ZHU Jie.Tone model integration based on discriminative weight training for Putonghua speech recognition[J].Chinese Journal of Acoustics,2008,27(3):193-202.

二级引证文献15

1徐利敏,唐振民,何可可,钱博.基于加权特征补偿变换的说话人识别仿真研究[J].系统仿真学报,2008,20(3):616-619. 被引量：1
2武永星,郑海,周波,杨常青,李茂林.基于距离和相关性准则的混合参数说话人识别[J].系统仿真学报,2008,20(4):926-930.
3陈妮,盛利元,肖小清,袁益民.基于自适应补偿的文本无关说话人识别[J].计算机仿真,2008,25(6):277-280.
4徐利敏,唐振民,何可可,钱博.基于自适应直方图均衡化的鲁棒性说话人辨认研究[J].自动化学报,2008,34(7):752-759. 被引量：5
5钱博,唐振民,李燕萍,徐利敏.基于背景噪声估计的说话人识别算法[J].计算机工程,2008,34(14):14-16. 被引量：1
6俞一彪,袁冬梅,薛峰.一种适于说话人识别的非线性频率尺度变换[J].声学学报,2008,33(5):450-455. 被引量：13
7李燕萍,唐振民,钱博,张燕.基于PLAR特征补偿的鲁棒性说话人识别仿真研究[J].系统仿真学报,2009,21(2):409-412. 被引量：2
8李燕萍,唐振民,张燕,丁辉.基于自适应频率规整的鲁棒说话人辨认研究[J].中文信息学报,2009,23(4):88-94.
9YU Yibiao YUAN Dongmei XUE Feng.A non-linear frequency transform and its application to speaker recognition[J].Chinese Journal of Acoustics,2009,28(3):280-288. 被引量：1
10侯丽敏,黄振华,谢娟敏.声门下共鸣的谱规整用于非特定人的语音识别[J].声学学报,2010,35(5):580-586.

1赵力,邹采荣,吴镇扬.基于3维空间Viterbi算法的汉语连续语音识别方法[J].电子学报,2000,28(7):67-69. 被引量：5
2黄利彬,曲爱华.基于灵敏度的雷达组网性能分析[J].舰船电子工程,2010,30(2):111-113.
3许晓斌,林碧琴,陈芳,傅秋良,袁保宗.音素隐马尔可夫模型的训练及分布共享[J].北方交通大学学报,1998,22(3):11-16.
4李辉.LTE FDD&CDMA室内分布系统合路改造方案探讨[J].信息通信,2015,28(2):243-244. 被引量：3
5赵力,邹采荣,吴镇扬.汉语连续语音识别中语音处理和语言处理统合方法的研究[J].声学学报,2001,26(1):73-78. 被引量：9
6郭希蕊,张涛.2.3GTD-LTE和联通WCDMA系统合路互调干扰问题研究[J].移动通信,2015,39(12):15-20. 被引量：5
7杨海燕.组建高效的客户服务中心[J].电信科学,2000,16(8):20-23. 被引量：6
8Sony、东芝、日立已同意合并中小尺寸面板事业[J].网印工业,2011(9):52-52.
9张辉,杜利民.汉语连续语音识别中不同基元声学模型的复合[J].电子与信息学报,2006,28(11):2045-2049. 被引量：7
10陈东华,吴睿,谢少军,周波.基于FPGA的三相四线有源滤波器的电流控制方案[J].电力系统自动化,2006,30(3):56-60. 被引量：5

声学学报

2001年第3期

浏览历史

内容加载中请稍等...

基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究被引量：3

参考文献8

二级参考文献8

共引文献8

同被引文献40

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究 被引量：3

参考文献8

二级参考文献8

共引文献8

同被引文献40

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究被引量：3