传统的动态时间规整(Dynamic Time Warping)算法虽然可以有效解决语音信号特征参数序列比较时时长不等的问题,但计算量很大,严重影响了语音识别系统的响应速度。对传统的动态时间规整算法进行改进,主要目的是提高语音识别速率。首先对传...传统的动态时间规整(Dynamic Time Warping)算法虽然可以有效解决语音信号特征参数序列比较时时长不等的问题,但计算量很大,严重影响了语音识别系统的响应速度。对传统的动态时间规整算法进行改进,主要目的是提高语音识别速率。首先对传统DTW算法的原理进行了详细的分析,然后提出了改进后新的DTW算法。对传统的算法进行改进时,主要从以下两方面入手:1对算法的搜索路径进行约束,使x轴上的每一帧不必再与y轴上的每一帧进行比较,而只需要与y轴上限定范围内的帧进行比较即可;2对齐松弛算法的起始点和终止点(不用完全对齐),并可以适当放松起始点和终止点两三帧。实验表明,系统在失真度基本保持不变的基础上,运行速率提高了近2倍。展开更多
大部分系统使用深度学习技术完成语音识别任务,并取得良好的效果。但是,基于深度学习的语音识别技术对计算机硬件算力的要求较高,同时需要大量的语音样本对语音识别模型进行训练。针对这些问题,基于改进后的动态时间归整(Dynamic Time W...大部分系统使用深度学习技术完成语音识别任务,并取得良好的效果。但是,基于深度学习的语音识别技术对计算机硬件算力的要求较高,同时需要大量的语音样本对语音识别模型进行训练。针对这些问题,基于改进后的动态时间归整(Dynamic Time Warping,DTW)算法设计并实现了一个语音识别系统。展开更多
文摘传统的动态时间规整(Dynamic Time Warping)算法虽然可以有效解决语音信号特征参数序列比较时时长不等的问题,但计算量很大,严重影响了语音识别系统的响应速度。对传统的动态时间规整算法进行改进,主要目的是提高语音识别速率。首先对传统DTW算法的原理进行了详细的分析,然后提出了改进后新的DTW算法。对传统的算法进行改进时,主要从以下两方面入手:1对算法的搜索路径进行约束,使x轴上的每一帧不必再与y轴上的每一帧进行比较,而只需要与y轴上限定范围内的帧进行比较即可;2对齐松弛算法的起始点和终止点(不用完全对齐),并可以适当放松起始点和终止点两三帧。实验表明,系统在失真度基本保持不变的基础上,运行速率提高了近2倍。