应用于语音识别片上系统的语音检测算法被引量：3

A Speech Detection Algorithm for Speech Recognition Systems on Chip

下载PDF

导出

摘要语音识别技术的研究已经进入实用化阶段,而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程,分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统,通过实验验证了其对系统识别性能和噪声稳健性的有效保证。 With the development of speech recognition, a robust speech detector has been the integral part of the practical speech recognition system. In this paper we propose a new finite state machine (FSM) based speech detection algorithm. The inputs of the FSM are derived from a zero-crossing detector and a LML (Logarithm Maximum Likelihood) frame-energy detector, where two kinds of noise robust energy are respectively used for MFCC and LPCC. Based on the proposed scheme, a small-vocabulary mandarin speech recognition system on OAK DSP can give real-time accurate speech recognition result. Experiments have been conduct to verify the viability of the proposed algorithm.

作者梁维谦许海国陈一宁刘加刘润生

机构地区清华大学电子工程系

出处《电路与系统学报》 CSCD 2003年第2期66-70,79,共6页 Journal of Circuits and Systems

基金国家自然科学基金资助项目(60272016)

关键词语音识别 OAK 语音检测有限状态机 Speech Recognition OAK Speech Detection Finite State Machine

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1[1]Khaled, et al . Comparison of Voice Detection Algorithms for Wireless Personal Communications [A]. Proc. CCECE-97[C]. 470-473.
2[2]ITU Recommendation. Annex A to G.723.1. Silence compression scheme for Dual speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s [S]. 1996-11.
3[3]ITU Recommendation. Annex B to G.729. A Silence Compression Scheme for G.729 Optimized for terminals Conforming to ITU-T V.70[S].
4[4]Arnaud Martin, Delphine Charlet, Laurent Mauuary. Robust Speech/non-speech Detection Using LDA Applied to MFCC [A]. Proc. IEEE International Conference On Acoustics, Speech, and Signal Processing, 2001[C]. 237 -240.
5[5]Francesco Beritelli, Salvatore Casale and Alfredo Cavallaro. A Robust Voice Activity Detector for Wireless Communications Using Soft Computing[J]. IEEE Journal On Selected Areas in Communications, 1998, 16(9): 1818-1829.
6[6]Mauuary L, Monné J. Speech/non-speech Detection for Voice Response Systems[A]. Proc. Eurospeech-93 [C]. 1097-1100.
7[7]Saul, L K, Rahim M G. Maximum Likelihood and Minimum Classification Error Factor Analysis for Automatic Speech Recognition [J]. IEEE Trans. On Speech and Audio Processing, 2000, 8(2): 115-125.
8[8]Anthony LITTLE, Dr. Leon REZNIK. Speech Detection Method Analysis and Intelligent Structure Development [A]. Proc. 1996 Australian New Zealand Conf. On Intelligent Information Systems [C]. 1097-1100.
9[9]XU Haiguo LI Husheng, LIU Jia, LIU Runsheng. Endpoint Detection Algorithm For Mandarin Digit Recognition Using DSP[A]. ICSP'02 2002 Beijing, CHINA[C].
10[10]Lamel L, Rabiner R, Rosenberg J, Wilpon J. An Improved End-point Detector for Isolated Word Recognition [J]. Proc. IEEE ASSP Magazine, 1981: 777-785.

同被引文献18

1果永振,何遵文.一种多特征语音端点检测算法及实现[J].通信技术,2003,36(1):8-10. 被引量：8
2严剑峰,付宇卓.一种新的基于信息熵的带噪语音端点检测方法[J].计算机仿真,2005,22(11):117-119. 被引量：13
3李宏松,苏健民,黄英来,于慧伶.基于声音信号的特征提取方法的研究[J].信息技术,2006,30(1):91-94. 被引量：26
4陈方,高升.语音识别技术及发展[J].电信科学,1996,12(10):54-57. 被引量：26
5柴君,赵振东,戚银城,王斌.基于谱减法的语音端点检测算法[J].华北电力大学学报（自然科学版）,2006,33(3):63-65. 被引量：6
6余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
7Qi Li,Jin Songzheng,Tsai A,et al.Robust endpoint detection and ener-gy normalization for real time speech and speaker recognition[J].IEEETransactions on Speech and Audio Processing,2002,10(3):146-152.
8刘华平,李昕,徐柏龄,姜宁.语音信号端点检测方法综述及展望[J].计算机应用研究,2008,25(8):2278-2283. 被引量：40
9李志忠,滕光辉.基于改进MFCC的家禽发声特征提取方法[J].农业工程学报,2008,24(11):202-205. 被引量：25
10吴伟,李楠,郭茂耘.粗糙集及PSO优化BP网络的故障诊断研究[J].计算机科学,2011,38(11):200-203. 被引量：7

引证文献3

1李宏松,苏健民,黄英来,于慧伶.基于声音信号的特征提取方法的研究[J].信息技术,2006,30(1):91-94. 被引量：26
2金敏.多特征和神经网络相结合的语音端点检测算法[J].计算机应用与软件,2013,30(5):307-310. 被引量：2
3曹晓慧,刘晃,戚仁宇,张成林,刘世晶.循环水养殖大口黑鲈摄食颗粒饲料的声学特征[J].农业工程学报,2021,37(20):219-225. 被引量：4

二级引证文献32

1万旺根,常辽豫,余小清,崔滨,刘晗.音频信息检索研究现状与发展趋势[J].上海大学学报（自然科学版）,2007,13(4):363-370. 被引量：3
2赵忠彪,李文鑫,高荣.基于神经网络的矢量量化算法在语音辨识系统中的应用研究[J].河南科学,2008,26(7):839-841. 被引量：1
3李建文,唐甜.编程实现模拟信号发生器[J].陕西科技大学学报（自然科学版）,2008,26(5):106-109.
4吴佩贤,王瑞荣,王建中,邹洪波,薛安克,孙映宏,何晓洪.基于音频识别的钱塘江潮涌实时监测技术[J].机电工程,2009,26(4):74-76. 被引量：4
5伟利国,张小超,吴文彪.鸟鸣叫声特征提取方法的研究[J].辽宁师范大学学报（自然科学版）,2010,33(1):108-111. 被引量：3
6陈武平,张思杰.基于音频识别的锅炉爆管事故的监测分析[J].硅谷,2010,3(12):84-84.
7陈吉刚.钢琴击弦机构性能评价系统研究[J].中国新技术新产品,2010(18):4-5.
8王新江,程飞,王孝红.雷电声音模式识别[J].信息技术与信息化,2011(1):80-82. 被引量：3
9吴为民,吴文兵.语音小波去噪效果的复倒谱分析[J].微计算机信息,2012,28(9):482-483.
10张莉,袁竞杰.模拟信号量化及调制方式的抗噪性能仿真研究[J].信息技术,2012,36(8):124-126. 被引量：2

1飞思卡尔建成200mm MEMS生产线[J].电子设计应用,2008(3):120-120.
2季旭东.磁性掺杂技术：让OLED效率提高30％[J].光电技术,2007,48(4):46-46.
3吴谨,王绍纯.神经网络在汉语语音识别中的应用[J].北京科技大学学报,1998,20(4):372-375.
4范章君.基于小波变换的语音检测算法[J].科技风,2009(3).
5Oak Ridge国家试验室开发双模式RFID读片器[J].金卡工程,2004,8(9):13-13.
6宋园方.说话人识别技术的研究[J].网络财富,2010(20):185-185.
7丁洪涧,金力军,孙锦华.相位估计和最大似然判决相结合提高π/4DQPSK译码性能的研究[J].电子科技,2006,19(2):36-39. 被引量：1
8Oak推出最低成本家庭网关器解决方案[J].电子设计应用,2003(3):96-96.
9贾克明,陶洪久.基于DSP的嵌入式语音识别系统的研究与实现[J].武汉理工大学学报（信息与管理工程版）,2006,28(7):156-159. 被引量：4
10唐宏梅.抛弃电视台[J].互联网周刊,2008(1):16-16.

电路与系统学报

2003年第2期

浏览历史

内容加载中请稍等...

应用于语音识别片上系统的语音检测算法被引量：3

参考文献10

同被引文献18

引证文献3

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

应用于语音识别片上系统的语音检测算法 被引量：3

参考文献10

同被引文献18

引证文献3

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

应用于语音识别片上系统的语音检测算法被引量：3