基于MFCC提取和DTW优化的连续音频识别算法设计

Design of Continuous Audio Recognition Algorithm Based on MFCC Extraction and DTW Optimization

下载PDF

导出

摘要介绍了一种新型的利用梅尔频率倒谱系数(MFCC)提取和动态时间规整技术(DTW)优化的连续音频识别算法。首先对数学原理与算法步骤进行设计与规划,使用大规模音频数据库进行预处理,经过时域和频域分析提取相应的特征;然后利用双门限法把连续音频切分为不同的音频块,并对切分部分进行针对性识别,将其与时频域数据库的模板进行匹配比对,实现了较好的连续音频识别效果,在时域和频域识别上的准确性均能达到89%。该研究成果可应用于钢琴教学系统的开发,尤其是在辅助学习者正确弹出曲谱方面具有广阔的应用前景。 This paper introduces a new continuous audio recognition algorithm based on Mel Frequency Cepstral Coefficents(MFCC) extraction and Dynamic Time Warping(DTW) optimization.Firstly,the mathematical principles and algorithm steps are planned and designed.With the large-scale audio database preprocessed,the corresponding features are extracted through time domain and frequency domain analysis.Then,continuous audio is segmented into different audio blocks by double threshold method,and the segmented part is identified pertinently,and the template of time-frequency domain database is matched and compared to achieve a better continuous audio recognition effect.In the time domain and frequency domain recognition can reach 89% accuracy.The research results can be applied to the development of piano teaching system,especially in assisting learners to correctly play music,which has broad application prospects.

作者王鸿瑞张玉辰陈鹭高博韬高昕悦 Wang Hongrui;Zhang Yuchen;Chen Lu;Gao Botao;Gao Xinyue(Xi'an Jiaotong University,Xi'an,710049,China)

机构地区西安交通大学

出处《中国现代教育装备》 2024年第17期41-45,52,共6页 China Modern Educational Equipment

关键词语音识别端点检测梅尔频率倒谱系数动态时间规整算法时频域分析 speech recognition endpoint detection mel rrequency cepstral coefficents dynamic time warping algorithm time-frequency domain analysis

分类号 TN912.34 [电子电信—通信与信息系统] G434 [文化科学—教育技术学]

引文网络
相关文献

1庄小亮,李乾坤,秦秉东,张长虹,张柳健,张禄亮.基于MFCC和随机森林的GIS动作声纹特征辨识和操作机构异常分类[J].电机与控制应用,2024,51(3):10-20.
2尹进田,何志龙,刘丽,邵武.基于改进DTW算法的永磁同步电机失磁故障模拟与诊断[J].邵阳学院学报（自然科学版）,2024,21(4):1-10.
3周立方,万亚平.针对动物领导关系的可变寻正时滞传递熵[J].计算机工程与设计,2024,45(9):2785-2795.
4陈剑,姜涛,陈品.基于声信号的离心泵故障诊断研究[J].电子测量与仪器学报,2024,38(5):169-177.
5张冬莹,叶培韬,李洽胜,简文华,梁振宇,郑劲平.肺部听诊音数据库建库技术及方法研究[J].中国全科医学,2024,27(36):4598-4608.
6郭威,颜清,曾智翔,童玲.基于小波分析的10 kV配网线路单端故障定位方法[J].电子设计工程,2024,32(19):169-172.
7谭少林,谷海波,刘克新.多智能体博弈中的分布式学习:原理与算法[J].指挥与控制学报,2024,10(2):127-136.
8陈明冬.智慧高速公路机电工程建设项目管理分析[J].运输经理世界,2024(23):147-149.
9吴红艳.水利工程在节水灌溉中的应用及效果[J].水上安全,2024(17):90-92.
10冷卓悦,高逸铖,沈乐欣.基于景观生态学的城市水域环境设计与规划方法研究[J].中文科技期刊数据库（全文版）工程技术,2024(9):0021-0024.

中国现代教育装备

2024年第17期

浏览历史

内容加载中请稍等...

基于MFCC提取和DTW优化的连续音频识别算法设计

相关作者

相关机构

相关主题

浏览历史