基于改进ESC算法的语音端点检测及FPGA实现

VAD based on improved ESC algorithm and FPGA implementation

下载PDF

导出

摘要针对语音端点检测的特征参数算法计算复杂、难以适用于硬件平台等问题,对传统的能量统计复杂度算法进行优化。经过预处理的语音数据快速傅里叶变换后只取正频率部分,通过前半帧的频率分量计算谱线能量与其对数值,得到复杂度,省略了概率密度的计算。改进后的能量统计复杂度算法能够逐帧地对语音信号进行流水线计算,具有运算量少、数据处理效率高、适合硬件操作的特点。语音端点检测系统通过单参数双门限端点检测判断,采用EP4CE22E22C8型号的FPGA实现。试验结果表明,系统在高信噪比与低信噪比环境中均有较好的检测效果,语音起点检测的滞后时间为96ms,实时性好。 In order to solve the problems of characteristic parameter algorithm of voice activity detection(VAD) such as high computational complexity and difficulty of application to hardware platform, the traditional energy statistics complexity algorithm is optimized. After the preprocessed speech data were transformed by fast fourier transform, only the positive frequency part was taken. The spectrum energy and its logarithm were calculated through the frequency component of the first half frame. It can get the value of complexity and omit the calculation of probability density. This improved algorithm can calculate speech signals by pipelining frame by frame. It has the characteristics of less computation and high data processing efficiency and is suitable for hardware operation. Speech endpoint detection system was judged by single parameter double threshold endpoint detection and implemented by the EP4CE22E22C8 model of FPGA. The experimental results show as follow: The system can effectively detect voice activity in high and low signal-to-noise ratio environments. The delay time of voice start detection is 96ms. The system has good real-time performance.

作者郭来功陈松 GUO Laigong;CHEN Song(College of Electrical and Information Engineering,Anhui University of Science and Technology,Huainan 232001,China)

机构地区安徽理工大学电气与信息工程学院

出处《电视技术》 2019年第2期56-60,110,共6页 Video Engineering

关键词语音端点检测能量统计复杂度算法流水线计算双门限端点检测 FPGA voice activity detection energy statistics complexity algorithm pipelining calculation double threshold endpoint detection FPGA

分类号 TN791 [电子电信—电路与系统]

引文网络
相关文献

参考文献9

1冯璐,王路露,张磊,张华东.车载环境下的语音端点检测方法[J].测控技术,2016,35(3):39-41. 被引量：2
2韩立华,王博,段淑凤.语音端点检测技术研究进展[J].计算机应用研究,2010,27(4):1220-1226. 被引量：39
3张君昌,姜菲,刘红.多特征相结合的带噪语音端点检测算法的研究[J].计算机工程与应用,2009,45(32):114-116. 被引量：13
4包亚萍,郑骏,武晓光.基于SG/Simulink语音端点检测的设计与实现[J].计算机工程与设计,2011,32(4):1383-1386. 被引量：1
5吴边,王忠,刘兴涛.强背景噪声下语音端点检测的算法研究[J].计算机工程与应用,2011,47(33):137-139. 被引量：6
6樊炳辉,卢凤,王鑫,刘圭圭.智能上假肢特定人语音识别系统实现[J].计算机工程与设计,2017,38(6):1630-1634. 被引量：9
7刘峰涛,贺国光.基于近似熵和统计复杂度的交通流复杂性测度[J].中国公路学报,2007,20(4):108-112. 被引量：19
8何伟,徐阳,张玲.基于SOPC的说话人识别算法的实现与优化[J].计算机应用,2012,32(5):1463-1466. 被引量：3
9张羊,姜汉钧,王志华.一种双门限语音端点检测算法的ASIC实现[J].微电子学与计算机,2016,33(11):69-73. 被引量：3

二级参考文献139

1郑为中,史其信.基于贝叶斯组合模型的短期交通量预测研究[J].中国公路学报,2005,18(1):85-89. 被引量：47
2俞礼军,严海,严宝杰.最大熵原理在交通流统计分布模型中的应用[J].交通运输工程学报,2001,1(3):91-94. 被引量：45
3黄铮,邹群,邹国平.基于Multi-Agent的高速公路集成交通控制系统[J].交通运输工程学报,2005,5(1):116-119. 被引量：12
4何兆成,余志.城市道路网络动态OD估计模型[J].交通运输工程学报,2005,5(2):94-98. 被引量：24
5胡瑞敏,薛东辉,姚天任,黄铁侠.神经网络方法及其在语音识别中的应用[J].高技术通讯,1995,5(6):11-15. 被引量：5
6刘晓明,覃胜,刘宗行,江泽佳.语音端点检测的仿真研究[J].系统仿真学报,2005,17(8):1974-1976. 被引量：21
7刘鹏,王作英.多模式语音端点检测[J].清华大学学报（自然科学版）,2005,45(7):896-899. 被引量：6
8张仁志,崔慧娟.基于短时能量的语音端点检测算法研究[J].电声技术,2005,29(7):52-54. 被引量：45
9张卫华,陆化普.公交优先的预信号控制交叉口车辆延误分析[J].中国公路学报,2005,18(4):78-82. 被引量：50
10李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37

共引文献83

1张美坤,黄晓明,徐志红.城市道路交通流的复杂度研究[J].交通运输工程与信息学报,2009,7(3):102-106. 被引量：6
2刘峰涛,贺国光.二维数组复杂性测度的统计复杂度改进[J].哈尔滨工业大学学报,2009,41(10):150-153.
3张勇,关伟.基于联合熵和C0复杂度的交通流复杂性测度[J].计算机工程与应用,2010,46(15):22-24. 被引量：5
4程迎迎,陈飞,黄晓明,庄威,王芳.不同特性驾驶员指路标志信息认知差异[J].东南大学学报（自然科学版）,2010,40(4):871-875. 被引量：12
5王红丽,崔荣一.基于SVM的说话声实时检测[J].延边大学学报（自然科学版）,2010,36(3):257-262.
6陈胜红,贺振华,朱明,汪瑞良,陈雪芳,文晓涛,姜建,曾驿.基于EMD和近似熵的储层预测[J].天然气地球科学,2010,21(5):828-832. 被引量：1
7林雪梅.强噪声环境下自适应语音端点检测算法[J].计算机工程与科学,2011,33(1):94-96. 被引量：1
8周夕良.基于不同背景噪声的联合检测技术[J].计算机与现代化,2011(3):153-155.
9陈业华,赵国超.路网交通流二层规划模型及其极大熵解[J].燕山大学学报,2011,35(2):178-183. 被引量：1
10李灵光.一种时频结合的抗噪性端点检测算法[J].计算机与现代化,2011(8):29-31. 被引量：5

1刘国营.例谈“精准教学”在高中地理课堂教学中的应用[J].中学地理教学参考,2018,0(13):48-50. 被引量：1
2胡晓,王昕,黄建荧,刘东,肖志怀.基于变分模态分解和复杂度分析的水电机组振动信号特征提取[J].中国农村水利水电,2019(1):188-192. 被引量：6
3张春国,樊群超,王雨露,付佳,范志祥.Cl2^＋离子P支高激发振转态的跃迁谱线[J].光谱学与光谱分析,2017,37(9):2703-2711.
4赵翠莲,马双驰,柳叶潇.基于样本熵和个体化阈值的表面膈肌肌电信号起点检测[J].生物医学工程学杂志,2018,35(6):852-859. 被引量：1
5李文杰,闫世强,蒋莹,张松芝,王成良.自适应确定DBSCAN算法参数的算法研究[J].计算机工程与应用,2019,55(5):1-7. 被引量：105
6刘海燕.探讨两个随机变量的和分布的求解[J].科教导刊（电子版）,2019,0(2):188-188.
7季正勃.试析高清混合视频矩阵的研究及FPGA实现[J].数字通信世界,2019(1):246-246. 被引量：1
8陈锐锋.数据挖掘技术在移动通信网络优化中的应用研究[J].信息周刊,2018,0(30):217-217.
9和丽华,江涛,潘文林,杨建香,解雪琴,王璐,余彩裙.佤语语音语料端点检测算法[J].云南民族大学学报（自然科学版）,2019,28(2):186-190. 被引量：2
10王飞宇,胡靖.基于FPGA实现粒子群算法解最短路径[J].数字通信世界,2019(1):277-277.

电视技术

2019年第2期

浏览历史

内容加载中请稍等...

基于改进ESC算法的语音端点检测及FPGA实现

参考文献9

二级参考文献139

共引文献83

相关作者

相关机构

相关主题

浏览历史