基于梅尔频率倒谱系数的语音清晰度DRT识别

Speech Articulation DRT Recognition Based On Mel Frequency Cepstral Coefficient

下载PDF

导出

摘要语音清晰度在通信终端、设备系统语音识别方面具有重要意义。本文对110dB噪声干扰下采集到的语音信号进行谱减法降噪,双门限端点检测提取发音字段,然后提取梅尔频率倒谱系数(MFCC),再将其进行差分计算,得到一阶和二阶分量,结合短时能量作为语音信号的特征参数,最后通过动态时间归整(DTW)进行相似度识别。实验表明,本文算法对汉语清晰度诊断押韵测试(DRT)字表的测试结果高达92.90%,有良好的识别率。 Speech articulation plays an important role in speech recognition of communication terminals and equipment systems.In this paper,under the interference of 110 dB noise,the collected speech signal is denoised by spectral subtraction,the pronunciation field is extracted by double-threshold endpoint detection,and then the Mel Frequency Cepstral Coefficients(MFCC)is extracted,and the difference calculation is carried out to obtain the first-order and second-order components,and the short-time energy is used as the characteristic parameter of the speech signal.Finally,Dynamic Time Warping(DTW)is used for similarity recognition.The experimental results show that the algorithm has a high recognition rate of 92.90%for Chinese articulation Diagnostic Rhyme Test(DRT).

作者马成龙焦俊清焦富清王杰陈巧特谢武俊李军 Ma Chenglong;Jiao Junqing;Jiao Fuqing;Wang Jie;Chen Qiaote;Xie Wujun;Li Jun(Wuhan Patron Data Technology Co.,Ltd,Wuhan 430205,China;Hongyu Life Saving Equipment Co.,Ltd,Xiangyang 441058,China)

机构地区武汉普创数据科技有限公司航宇救生装备有限公司

出处《信息化研究》 2024年第2期63-68,共6页 INFORMATIZATION RESEARCH

关键词语音清晰度谱减法端点检测梅尔频率倒谱系数动态时间归整汉语清晰度诊断押韵测试 speech articulation spectral subtraction endpoint detection Mel Frequency Cepstral Coefficients Dynamic Time Warping Diagnostic Rhyme Test

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1杨龙,陈建明.语音增强算法及进展[J].电声技术,2015,39(7):35-39. 被引量：5
2陈志博,王思雨,刘远泽,王国栋,耿卫东.一种基于改进多带谱减法的低信噪比语音识别方法[J].南开大学学报（自然科学版）,2022,55(6):58-61. 被引量：3
3樊一帆,张丽丹.强噪环境基于谱减法的录音数字音频信号降噪[J].计算机仿真,2023,40(11):433-436. 被引量：5
4刘满荣,张苗.基于改进谱减法和声学模型的学前儿童机器人语音识别系统研究[J].自动化与仪器仪表,2023(6):179-183. 被引量：1
5黄洋,赵风海,卢景.语音信号处理中双门限端点检测算法的改进[J].南开大学学报（自然科学版）,2021,54(2):58-62. 被引量：8
6柏顺,颜夕宏,张生平,陈建飞,张胜.基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测[J].南京师大学报（自然科学版）,2021,44(2):117-120. 被引量：9
7杨路飞,章新华,吴秉坤,李兰瑞.基于MFCC特征的被动水声目标深度学习分类方法[J].舰船科学技术,2020,42(10):129-133. 被引量：7
8周炳良,邓立新,洪民江.一种新的基于DTW的孤立词语音识别算法[J].计算机技术与发展,2018,28(4):119-123. 被引量：7
9郭莉莉,陈永红.一种改进的谱减法语音增强算法[J].通信技术,2021,54(6):1350-1355. 被引量：8
10薛胜尧.基于改进型双门限语音端点检测算法的研究[J].电子设计工程,2015,23(4):78-81. 被引量：21

二级参考文献107

1邓江波,侯新国,吴正国.基于箕舌线的变步长LMS自适应算法[J].数据采集与处理,2004,19(3):282-285. 被引量：59
2张仁志,崔慧娟.谱相减法语音增强技术中“音乐噪声”的抑制[J].电声技术,2005,29(5):35-38. 被引量：9
3陶智,赵鹤鸣,龚呈卉.基于听觉掩蔽效应和Bark子波变换的语音增强[J].声学学报,2005,30(4):367-372. 被引量：39
4封伶刚,王秀萍.一种新的基于LBG和DTW的模板训练算法[J].计算机工程与应用,2005,41(26):85-88. 被引量：3
5陈立万.基于语音识别系统中DTW算法改进技术研究[J].微计算机信息,2006,22(02Z):267-269. 被引量：28
6王莉,胡剑凌,徐盛.基于听觉掩蔽效应的语音增强算法的研究[J].电声技术,2006,30(7):39-42. 被引量：3
7白文雅,黄健群,陈智伶.基于维纳滤波语音增强算法的改进实现[J].电声技术,2007,31(1):44-46. 被引量：14
8赵力.语音信号处理[M].北京:机械工业出版社,2010.
9He Suning Yu, Juebang. A. Novel Chinese Continuous Speech Endpoint Detection Method Based on Time Domain Features of the Word Structure.IEEE Int.Conf.on Commun.Circuits and Systems and West Sino Expositions, 2002.992-996.
10Qi Li, Jinsong zheng, Tsai A, et al. Robust Endpoint Deteetion and Energy Normalization for Real-Time Speeeh and Speaker Reeognition.IEEE Transaetions on Speeeh and Audio Proeessing, 2002,10(3): 146-152.

共引文献81

1杨雄,郭佳豪,方鑫,张旭辉.基于改进动态时间规整算法的终端波形比对方法[J].电子测量技术,2023,46(6):178-184.
2张婷,何凌,黄华,刘肖珩.基于小波及能量熵的带噪语音端点检测算法[J].计算机工程与设计,2013,34(4):1331-1335. 被引量：3
3惠晓威,李坤.动力学特征分析在语音端点检测中的应用[J].计算机应用与软件,2013,30(12):299-302. 被引量：1
4王桂荣,金小峰.语音段中朝蒙单元音概率分布的对比分析[J].延边大学学报（自然科学版）,2018,44(3):260-265. 被引量：1
5薛胜尧.基于改进型双门限语音端点检测算法的研究[J].电子设计工程,2015,23(4):78-81. 被引量：21
6郭琳,苏洁,李余芳,刘敬凤,胡文君,潘文林.一种人机交互语音切分系统[J].云南民族大学学报（自然科学版）,2016,25(1):87-91. 被引量：4
7恩德,陈亚柯,毛哲龙.基于FastICA的低信噪比下L-PLC语音的间断传输[J].计算机工程与应用,2016,52(9):108-111. 被引量：2
8马辉栋,刘振宇.语音端点检测算法在猪咳嗽检测中的应用研究[J].山西农业大学学报（自然科学版）,2016,36(6):445-449. 被引量：9
9刘玉珍,田金波.基于语音增强的双门限语音端点检测算法[J].测控技术,2016,35(11):33-35. 被引量：6
10邓子龄.外界环境下语音信号快速捕获仿真研究[J].计算机仿真,2017,34(1):296-299.

1陈双叶,徐雷桁,黄成意,张智武,张林,韩默.基于MobileNetV3卷积神经网络的供水管道漏损音频分类[J].北京工业大学学报,2024,50(7):797-804.
2张亮,李昌,张祥东,王海洋.测点位置对汽车风洞风噪测试结果的影响[J].汽车实用技术,2024,49(12):112-116.
3汪怡平,马瑞,邓峰,张科峰.侧风状态下车内气动噪声分析与优化[J].武汉理工大学学报,2024,46(4):119-124.
4黄海燕,高伟,邱仕达,杨耿杰.基于改进动态时间规整的直流电动机驱动负荷开关卡涩故障辨识[J].电气技术,2024,25(6):31-38.
5陈晓,曾昭优.基于声音特征优化和改进支持向量机的鸟声识别[J].测控技术,2024,43(6):21-25.
6胡建华,郭建丁,吴伟美,曾文英,刘晓林.基于深度学习的乒乓球姿态动作评分方法[J].微型电脑应用,2024,40(6):21-24.
7孟宇帆,张丽君,何长涛,肖婧,阳宁静,冯国英,韩敬华.基于图像处理的激光清洗飞机蒙皮特性和机制研究[J].激光技术,2024,48(3):303-311.
8刘书健,高延峰,张华.基于电弧声能量特征的焊缝位置检测方法研究[J].热加工工艺,2024,53(7):31-36.
9曾侨飞,李斌,李新福,陈佳豪,杨雨昂.基于相似日的光伏组件积灰损失预测[J].热力发电,2024,53(6):21-29.
10赖健,许志浩,康兵,王宗耀,丁贵立,袁小翠.基于ISSA-SVC的配电网高损台区窃电检测方法研究[J].电力系统保护与控制,2024,52(12):104-112. 被引量：1

信息化研究

2024年第2期

浏览历史

内容加载中请稍等...

基于梅尔频率倒谱系数的语音清晰度DRT识别

参考文献13

二级参考文献107

共引文献81

相关作者

相关机构

相关主题

浏览历史