高性能汉语数码语音识别算法被引量：20

High performance digit mandarin speech recognition

导出

摘要提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% . High performance mandarin digit speech recognition (MDSR) system is developed using MFCC (mel frequency cepstrum coefficient) as the main parameter identifying the speech patterns. The formant trajectory and the nasal feature are extracted to identify confused words. A feature based, real time endpoint detection algorithm is proposed to reduce the system resource requirements and to improve the disturbance proof ability. A two stage recognition frame enhances discrimination by identifying candidate words in the first stage and confused word pairs in the second stage. These improvements result in a correct recognition rate of 98.8%.

作者李虎生刘加刘润生

机构地区清华大学电子工程系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2000年第1期32-34,56,共4页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金项目!(6 9772 0 2 0 ) 国家"八六三"高技术项目! (86 3- 5 1 2 - 980 5 -1 0 )

关键词数码语音识别汉语语音识别算法语音识别 MDSR mandarin digit speech recognition

分类号 TN912.34 [电子电信—通信与信息系统] TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1顾良,刘润生.汉语数码语音识别:发展现状、难点分析与方法比较[J].电路与系统学报,1997,2(4):32-39. 被引量：12
2李虎生,杨明杰,刘润生.用共振峰轨迹提高汉语数码语音识别性能[J].清华大学学报（自然科学版）,1999,39(9):69-71. 被引量：2

二级参考文献4

1吴宗济林茂灿.实验语音学教程[M].北京:高等教育出版社,1989..
2顾良，清华大学学报，1998年，36卷，10期，36页
3吴宗济，实验语音学教程，1989年
4顾良,刘润生.利用声调判别提高汉语数码语音识别性能[J].清华大学学报（自然科学版）,1998,38(9):36-39. 被引量：7

共引文献12

1丁昊,姚天任.基于mel标度频谱和音素分割的汉语语音单词端点检测方法[J].计算机与数字工程,2005,33(3):57-59. 被引量：3
2翁素贞,贾宇清.连续语音串识别显示系统的研究与应用[J].城市轨道交通研究,2005,8(2):31-34.
3刘濛,杨康,崔向.基于嵌入式系统的特定说话人语音识别系统的实现[J].沈阳理工大学学报,2006,25(4):36-39. 被引量：1
4张培玲,王福忠,刘群坡.连续数码串语音识别系统的MATLAB实现[J].河南理工大学学报（自然科学版）,2009,28(2):211-216.
5史媛媛,刘加,刘润生.基于二次多项式后验概率估计的汉语数码语音识别[J].电路与系统学报,1999,4(4):36-41.
6钟林,刘润生.新神经网络结构及其在数码语音识别中的应用[J].清华大学学报（自然科学版）,2000,40(3):104-108. 被引量：2
7钟林,刘加,刘润生.A Rejection Model Based on Multi—Layer Perceptrons for Mandarin Digit Recognition[J].Journal of Computer Science & Technology,2002,17(2):196-202.
8周峰,俞一彪.群延时谱参数在汉语数字语音识别中的应用[J].信号处理,2017,33(9):1215-1220. 被引量：1
9陈远鹏,金奕丹,景新幸.语音识别技术在楼宇控制系统中的应用[J].电声技术,2003,27(3):39-41. 被引量：1
10程雪林,吴开政,李宗葛.汉语连续数字串识别的改进[J].计算机工程,2003,29(12):93-95.

同被引文献76

1曹犟,邬晓钧,夏云庆,郑方.基于拼音索引的中文模糊匹配算法[J].清华大学学报（自然科学版）,2009(S1):1328-1332. 被引量：14
2方敏,浦剑涛,李成荣,台宪青.嵌入式语音识别系统的研究和实现[J].中文信息学报,2004,18(6):73-78. 被引量：19
3武妍,金明曦,王洪波.基于KL-小波包分析的文本无关的说话人识别[J].计算机工程与应用,2005,41(4):26-28. 被引量：6
4关存太,陈永彬,吴伯修.HMM语音识别模型与一种修正训练算法[J].东南大学学报（自然科学版）,1994,24(1):17-24. 被引量：2
5丁玉国,刘加,刘润生.嵌入式系统上的实时语音识别算法[J].数据采集与处理,2005,20(3):302-305. 被引量：6
6芮贤义,俞一彪.基于小波变换的鲁棒型特征提取及说话人识别[J].电路与系统学报,2005,10(5):129-132. 被引量：7
7王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
8王守觉,徐春燕,潘晓霞,安冬,陈旭,曹文明.为连续语音识别用的单词音节神经网络建模的研究[J].电子学报,2005,33(10):1883-1885. 被引量：4
9李宏松,苏健民,黄英来,于慧伶.基于声音信号的特征提取方法的研究[J].信息技术,2006,30(1):91-94. 被引量：25
10刘雅琴,裘雪红.应用小波包变换提取说话人识别的特征参数[J].计算机工程与应用,2006,42(9):67-69. 被引量：15

引证文献20

1徐国庆,杨丹,王彬洁,文俊浩.乐音识别方法及应用[J].计算机应用,2005,25(4):968-970. 被引量：9
2张静亚.基于CHMM的高性能连续数字语音识别算法[J].常熟理工学院学报,2005,19(2):93-96. 被引量：4
3徐国庆,杨丹,王彬洁,文俊浩.FRED和DWT在乐音音符识别中的应用研究[J].计算机工程与应用,2005,41(18):191-193. 被引量：5
4王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
5王守觉,徐春燕,潘晓霞,安冬,陈旭,曹文明.为连续语音识别用的单词音节神经网络建模的研究[J].电子学报,2005,33(10):1883-1885. 被引量：4
6刘振安,孙捷,王晋军.小词汇量非特定人语音识别在嵌入式系统中的应用[J].计算机工程,2006,32(11):213-215. 被引量：5
7王欢良,韩纪庆,李海峰,郑铁然.基于HMM/SVM两级结构的汉语易混淆语音识别[J].模式识别与人工智能,2006,19(5):578-584. 被引量：4
8徐春辉,陆荣秀.基于16位单片机的电视机声控选台系统设计与实现[J].科技广场,2007(5):213-214.
9张培玲,王福忠,刘群坡.连续数码串语音识别系统的MATLAB实现[J].河南理工大学学报（自然科学版）,2009,28(2):211-216.
10陈吉刚.钢琴击弦机构性能评价系统研究[J].中国新技术新产品,2010(18):4-5.

二级引证文献69

1曹西征,刘春红,孙林.基于WAV文件的独奏乐曲信号中的乐谱识别[J].计算机应用,2009,29(3):768-770. 被引量：4
2王光艳,赵晓群,王霞.基于MATLAB GUI的语音信号特征提取系统设计[J].河北工业大学学报,2010,39(4):14-18. 被引量：11
3丁昊,姚天任.基于mel标度频谱和音素分割的汉语语音单词端点检测方法[J].计算机与数字工程,2005,33(3):57-59. 被引量：3
4毕文军,高健.语音人机界面标引系统的实现[J].微计算机信息,2005,21(4):232-233. 被引量：9
5王达伟,曹俊兴.一种基于噪音类型估计的端点检测系统[J].计算机工程与应用,2005,41(19):87-89. 被引量：1
6刘雅琴,周炜.基于小波变换的说话人语音特征参数提取[J].河南科技大学学报（自然科学版）,2005,26(4):44-46. 被引量：10
7王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
8王守觉,徐春燕,潘晓霞,安冬,陈旭,曹文明.为连续语音识别用的单词音节神经网络建模的研究[J].电子学报,2005,33(10):1883-1885. 被引量：4
9李仰祝.高校教师人力资源管理应注重“三个转变”[J].人才资源开发,2005(12):30-31.
10唐赟,刘文举,徐波.基于后验概率解码段模型的汉语语音数字串识别[J].计算机学报,2006,29(4):635-641. 被引量：12

1李虎生,杨明杰,刘润生.用共振峰轨迹提高汉语数码语音识别性能[J].清华大学学报（自然科学版）,1999,39(9):69-71. 被引量：2
2孙冰,宫宁生,朱梧槚.基于覆盖的神经网络集成在语音识别中的应用[J].南京大学学报（自然科学版）,2006,42(3):331-336. 被引量：3
3徐文盛,戴蓓倩,方绍武,陆伟.特定人汉语数码语音抗噪识别方法[J].电路与系统学报,2000,5(2):58-61. 被引量：1
4钟林,刘润生.新神经网络结构及其在数码语音识别中的应用[J].清华大学学报（自然科学版）,2000,40(3):104-108. 被引量：2
5王朋,陈树中.基于混合模型HMM/RBF的数字语音识别[J].计算机工程,2002,28(12):136-138. 被引量：7
6胡中栋,曾志勇.基于多路径的DSR路由协议改进[J].江西理工大学学报,2011,32(3):45-48. 被引量：3
7董明,刘加,刘润生.高性能汉语数码语音识别芯片系统[J].清华大学学报（自然科学版）,2003,43(9):1257-1260. 被引量：5
8钟明辉,李姮,李生华.基于HTK的汉语数码语音识别系统[J].贺州学院学报,2009,25(3):133-135.
9张培玲,李辉.基于混合模型CHMM和MLP的数码语音识别系统[J].工矿自动化,2009,35(12):64-68.
10顾良,刘润生.汉语数码语音识别:发展现状、难点分析与方法比较[J].电路与系统学报,1997,2(4):32-39. 被引量：12

清华大学学报（自然科学版）

2000年第1期

浏览历史

内容加载中请稍等...

高性能汉语数码语音识别算法被引量：20

参考文献2

二级参考文献4

共引文献12

同被引文献76

引证文献20

二级引证文献69

相关作者

相关机构

相关主题

浏览历史

高性能汉语数码语音识别算法 被引量：20

参考文献2

二级参考文献4

共引文献12

同被引文献76

引证文献20

二级引证文献69

相关作者

相关机构

相关主题

浏览历史

高性能汉语数码语音识别算法被引量：20