Mel频率下语音信号深度频谱特征提取方法仿真被引量：6

Simulation of Depth Spectrum Feature Extraction Method for Speech Signal under Mel Frequency

下载PDF

导出

摘要采用当前方法提取语音信号频谱特征时,不能有效去除语音信号中存在的噪声信号,提取得到的特征误差较大,存在抗干扰性能差和特征提取结果准确率低的问题。针对上述问题,提出Mel频率下语音信号深度频谱特征提取方法。对噪声信号进行经验模态分解,将分解得到的IMF分量进行门限域处理,通过对应的滤波方案去除语音信号中存在的噪声信号。采用Mel滤波器处理去噪后的语音信号,得到Mel频率的语音信号。利用线性预测系数描述Mel频率下的语音信号,并对其进行微分处理,将微分向量进行加权处理,根据一定的加权比例重组微分向量,利用语音信号深度频谱特征参数,完成Mel频率下语音信号的深度频谱特征提取。仿真结果表明,所提方法的抗干扰性能高、特征提取结果准确率高。 The current method cannot effectively remove the noise signal in voice signal. The extracted feature error is large. The anti-interference performance is poor and the accuracy of feature extraction result is low. Therefore, a method to extract the depth spectrum feature of voice signal at Mel frequency was proposed. The empirical mode decomposition was performed on the noise signal. The decomposed IMF component was subjected to threshold domain processing. The noise signal existing in voice signal was removed by the corresponding filtering scheme. Mel filter was used to process the denoised voice signal, so as to obtain the Mel frequency. The linear prediction coefficient was used to describe the voice signal at Mel frequency and the voice signal was differentiated. The differential vector was weighted. According to a certain weighting ratio, the differential vector was reconstructed. Finally, the depth spectrum feature parameter of voice signal was used to complete the depth spectrum feature extraction of voice signal at Mel frequency. Simulation results show that the proposed method has high anti-interference performance and high accuracy of feature extraction result.

作者张红兵 ZHANG Hong-bing(Criminal Investigation Police University of China,Shenyang Liaoning 110854,China)

机构地区中国刑事警察学院

出处《计算机仿真》北大核心 2020年第5期197-200,267,共5页 Computer Simulation

基金辽宁省自然科学基金指导计划项目(201602810) 公安理论及软科学研究计划项目(2017LLYJXJXY040)。

关键词语音信号深度频谱特征特征提取 Voice signal Depth spectrum feature Feature extraction

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1王群,曾庆宁,谢先明,郑展恒.低信噪比环境下的语音识别方法研究[J].声学技术,2017,36(1):50-56. 被引量：11
2张毅,谢延义,罗元,席兵.一种语音特征提取中Mel倒谱系数的后处理算法[J].智能系统学报,2016,11(2):208-215. 被引量：12
3王静,刘正辉,祁传达,王宏霞.一种抗特征分析替换攻击的数字语音取证算法[J].铁道学报,2016,38(6):73-78. 被引量：4
4宋春晓,孙颖.面向情感语音识别的非线性几何特征提取算法[J].计算机工程与应用,2017,53(20):128-133. 被引量：5
5张乐,张雪英,孙颖,张卫.基于聚合经验模态分解的情感语音特征提取[J].计算机工程,2017,34(8):306-309. 被引量：4
6李虹,徐小力,吴国新,丁春艳,赵学梅.基于MFCC的语音情感特征提取研究[J].电子测量与仪器学报,2017,31(3):448-453. 被引量：28
7乔玲玲,郭秀婷.人体语音特征提取身份优化验证仿真研究[J].计算机仿真,2017,34(2):342-345. 被引量：3
8林静,杨继臣,张雪源,李新超.基于稀疏表示权重张量的音频特征提取算法[J].计算机应用,2016,36(5):1426-1429. 被引量：5
9何朝霞,潘平,罗辉.音色变换音频信号的篡改检测技术研究[J].中国测试,2017,43(2):98-103. 被引量：3
10张毅,汪培培,罗元.基于MUSIC/MNM谱估计的鲁棒语音特征提取[J].信息与控制,2016,45(3):355-360. 被引量：1

二级参考文献91

1张鑫瑜,李雪耀,张汝波,于桂芬.基于语音抑制的飞机识别研究[J].华中科技大学学报（自然科学版）,2011,39(S2):291-294. 被引量：1
2王宏霞,范明泉.基于质心的混合域半脆弱音频水印算法[J].中国科学：信息科学,2010,40(2):313-326. 被引量：12
3张汝波,刘冠群,吴俊伟,吕西宝.移动机器人语音控制技术研究与实现[J].华中科技大学学报（自然科学版）,2013,41(S1):348-351. 被引量：8
4林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007,12(1):90-98. 被引量：33
5ZUBAIR S, WANG W. Audio classification based on sparse coefficients[C]//Sensor Signal Processing for Defence (SSPD 2011. London, UK:The Institution of Engineering and Technology Press, 2011:1-5.
6ZUBAIR S, YAN F, WANG W. Dictionary learning based sparse coefficients for audio classification with max and average pooling[J]. Digital Signal Processing, 2013, 23(3):960-970.
7CHU S, NARAYANAN S, KUO C C J. Environmental sound recognition with time-frequency audio features[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2009, 17(6):1142-1158.
8SIVASANKARAN S, PRABHU K M M. Robust features for environmental sound classification[C]//Proceedings of the 2013 IEEE International Conference on Electronics, Computing and Communication Technologies. Piscataway, NJ:IEEE, 2013:1-6.
9WANG J C, LIN C H, CHEN B W, et al. Gabor-based nonuniform scale-frequency map for environmental sound classification in home automation[J]. IEEE Transactions on Automation Science and Engineering, 2014, 11(2):607-613.
10TAKEUCHI K, ISHIGURO K, KIMURA A, et al. Non-negative multiple matrix factorization[C]//Proceedings of the 23rd International Joint Conference on Artificial Intelligence. Beijing:AAAI, 2013:1713-1720.

共引文献64

1高桥,张二华.基于基音周期轨迹的连续汉语语音切分技术研究[J].计算机与数字工程,2023,51(1):163-167.
2乔玲玲,郭秀婷.人体语音特征提取身份优化验证仿真研究[J].计算机仿真,2017,34(2):342-345. 被引量：3
3黎小胜,何凤.量子算法在数字语音领域的应用[J].高师理科学刊,2017,37(6):45-47.
4李盛,周斌,胡金艳,周鹏程,李涛,袁玉迪.奇异值分解在语音增强中的应用研究[J].徐州工程学院学报（自然科学版）,2017,32(3):53-56. 被引量：1
5孙国强,樊新海,石文雷.基于MFCC和支持向量机的装甲车辆识别研究[J].国外电子测量技术,2017,36(10):31-35. 被引量：11
6刘正辉,孙芳,祁传达.基于DWT的可恢复数字语音取证算法[J].铁道学报,2018,40(3):76-81.
7蒋久松,熊富强,毛文奇,张超峰.智能语音识别方法在电力移动作业平台中的应用[J].自动化应用,2017(11):124-127. 被引量：5
8陈树,于海波.一种改进的特征提取方法在语音识别中的应用[J].传感器与微系统,2018,37(5):154-157. 被引量：9
9黄春燕,景妮洁,祝红梅.语音信号的MATLAB分析与处理[J].计算机科学,2018,45(B06):555-558. 被引量：2
10高成吉.一种英语口语识别算法[J].信息技术,2018,42(8):148-151. 被引量：3

同被引文献77

1陈国平,梁志峰,董昱.基于能源转型的中国特色电力市场建设的分析与思考[J].中国电机工程学报,2020,40(2):369-379. 被引量：121
2宁继荣.一种语音信号基音频率提取算法的研究及实现[J].中国新通信,2020,0(3):70-70. 被引量：2
3胡敏.强干扰下多路电子通信信号自动捕获算法研究[J].舰船科学技术,2019,0(20):103-105. 被引量：4
4陶洪铸,翟明玉,许洪强,季学纯,刘金波,徐丽燕.适应调控领域应用场景的人工智能平台体系架构及关键技术[J].电网技术,2020,44(2):412-419. 被引量：36
5罗辉,韩纪庆.基于自适应结构图的半监督语音情感特征选择[J].智能计算机与应用,2021,11(3):1-8. 被引量：1
6刘伟,陈鸿昶,黄瑞阳.基于Tree-based CNN的关系抽取[J].中文信息学报,2018,32(11):34-40. 被引量：10
7刘思思,谭建平,易子馗.基于MFCC和SVM的车窗电机异常噪声辨识方法研究[J].振动与冲击,2017,36(5):102-107. 被引量：16
8崔维嘉,鲁航,巴斌.基于细化频谱的频率迭代插值估计算法[J].电子与信息学报,2017,39(9):2141-2147. 被引量：6
9张策,韦鹏程,陆晓燕,石熙.重庆方言语音识别系统的设计与实现[J].计算机测量与控制,2018,26(1):256-259. 被引量：7
10杨涛,黄军凯,许逵,吴建蓉,陈仕军.基于深度学习的变压器故障诊断方法研究[J].电力大数据,2018,21(6):23-30. 被引量：22

引证文献6

1高渝蓉,娄屹萍.高密度电子电路多通道频谱误差自动识别研究[J].通信电源技术,2020,37(22):34-35.
2唐琴.电子通信信号循环频率特征自提取方法研究[J].通信电源技术,2021,38(17):60-62.
3陈琳.面向语音特征提取的英语机器人识别方法构建[J].自动化与仪器仪表,2022(8):234-239.
4肖林,肖倩宏,魏莉莉,周艳云,汪适.基于大数据和深度学习的电网调度语音识别声学模型研究[J].电力大数据,2022,25(9):30-36. 被引量：2
5张锦豪,赵月爱.基于声学特征与自编码器的机械故障检测方法[J].计算机与数字工程,2024,52(2):512-520.
6缪江华.基于卷积神经网络的带式输送机托辊故障诊断[J].煤矿机械,2024,45(6):182-185.

二级引证文献2

1朱辉,李海涛,刘岳鑫,赵玮,钱骁,刘禹涵,高明阳.基于改进YOLOv5s网络的杆塔相关目标检测方法[J].电力大数据,2023,26(5):62-72. 被引量：3
2汪玉秀,苏战波.基于轻量化神经网络的多语音识别方法研究[J].自动化与仪器仪表,2023(10):167-169. 被引量：1

1田安红,付承彪,熊黑钢,赵俊三.BPNN对不同人为活动区域的盐渍土Na^+高光谱估测[J].水土保持研究,2020,27(2):364-369. 被引量：5
2高杨.基于Matlab的藏语语音频域特征参数提取分析[J].西藏科技,2020(2):38-43. 被引量：2
3唐泽坤,朱泽宇,杨裔,李彩虹,李廉.基于距离和密度的d-K-means算法[J].计算机应用研究,2020,37(6):1719-1723. 被引量：12
4屈翼展,伍建昌,胡乔林,陈新,王亨佳.短波信道下基于Spark的语音传输损失补偿研究[J].电子世界,2020(6):128-129.
5邓权伦,何海峰,向天堂,李雪松,王昕.CEEMD-SST去噪法在变压器套管引线超声检测中的应用[J].电气自动化,2020,42(3):99-102. 被引量：2
6白志刚,戴凌冉,吴晔,钟宁,杨光海.基于机载光电成像系统光学铰链离轴的伺服抗扰算法设计[J].计算机测量与控制,2020,28(5):220-223.
7薄文彦.群智感知网络任务渐进式分配仿真研究[J].计算机仿真,2020,37(5):255-258.
8郭茂强,黄云云,赵强,张经伟.IFD与KELM结合的滚动轴承故障诊断方法[J].福州大学学报（自然科学版）,2020,48(3):341-347. 被引量：6
9孙国栋,王俊豪,徐昀,林凯.CEEMD-WVD多尺度时频图像的滚动轴承故障诊断[J].机械科学与技术,2020,39(5):688-694. 被引量：18
10韩进,周慧敏,薛庆军.一种基于CR600的码激励线性预测算法及应用[J].中国科技论文,2019,14(11):1204-1209.

计算机仿真

2020年第5期

浏览历史

内容加载中请稍等...

Mel频率下语音信号深度频谱特征提取方法仿真被引量：6

参考文献10

二级参考文献91

共引文献64

同被引文献77

引证文献6

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Mel频率下语音信号深度频谱特征提取方法仿真 被引量：6

参考文献10

二级参考文献91

共引文献64

同被引文献77

引证文献6

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Mel频率下语音信号深度频谱特征提取方法仿真被引量：6